Gene SeHA_C3631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3631
Symbol	codB
ID	6489255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3517128
End bp	3518405
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	55%
IMG OID	642743749
Product	cytosine permease
Protein accession	YP_002047361
Protein GI	194447479
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1457] Purine-cytosine permease and related proteins
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	0.822935
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGCAAAA TTCATGGAGG CGTTGTGTCG CAGGACAACA ATTATAGCCA GGGCCCCGTC 
CCTCTGGCGG CGCGGAAGGG CGTGATTCCA CTGACGTTTG TCATGTTGGG TTTAACGTTT 
TTTTCCGCCA GTATGTGGAC CGGAGGGACA CTCGGCACCG GTCTTTCTTA TAATGATTTC 
TTCCTCGCAG TTCTCTTCGG TAATCTCCTC CTCGGTATCT ACACTGCATT TCTTGGTTAC 
ATCGGCGCAA AAACCGGACT CTCCACCCAC CTCCTTGCAC GTTACTCCTT TGGCGTTAAA 
GGCTCATGGC TTCCCTCGCT ACTGCTAGGC GGTACTCAAG TGGGCTGGTT TGGCGTTGGC 
GTAGCGATGT TCGCTATTCC GGTCAGTAAA GCGACGGGCA TTGATGCCAA TATTCTGATT 
GCCGTTTCGG GTCTACTGAT GACCCTGACC ATTTTTTTCG GCATCTCGGC GTTGACCATT 
TTGTCTATCA TTGCCGTACC CGCGATCGTG ATTCTGGGCA GCTACTCCGT CTGGCTGGCG 
GTCAGCGGCG TGGGTGGGCT GGAGCATTTA AAAACGATAG TGCCGCAGAC GCCGCTGGAT 
TTTTCCAGCG CGCTGGCGCT GGTGGTGGGC TCGTTTGTCA GCGCCGGTAC ATTGACCGCC 
GACTTCGTCC GCTTCGGGCG TCATGCCAAA AGCGCCGTAC TGATTGCGAT GGTCGCTTTT 
TTCCTCGGCA ACTCGCTGAT GTTTATCTTT GGCGCGGCAG GCGCTGCCGC CGTCGGTCAG 
GCGGATATCT CTGACGTGAT GATAGCGCAG GGGCTGCTGC TGCCCGCGAT TGTGGTGCTT 
GGCCTGAATA TCTGGACCAC CAACGATAAC GCGCTGTACG CATCGGGTCT GGGCTTCGCC 
AATATTACCG GTCTTTCCAG CCGTACGCTG TCGGTGGTGA ACGGGATTAT CGGTACCGTG 
TGCGCGCTGT GGCTTTACAA TAATTTTGTC GGCTGGCTGA CGTTCCTGTC ATCTGCCATC 
CCACCGATTG GCGGAGTGAT TATTGCCGAC TATCTGTTGA ACCGTCGCCG CTATGCCGAC 
TTCAACACCG TGCGCTTTAT TCCCGTTAAC TGGATTGCTA TTCTTTCCGT CGCGCTGGGC 
ATCGCCGCCG GACATTATGT TCCTGGTATT GTGCCCGTCA ACGCCGTACT CGGCGGCGTC 
TTCAGCTATA TCCTGCTGAA TCCACTTTTC AACCGCAGCC TTGCTAAATC ACCAGAGGTC 
AGCCATGCAG AACAATAA

Protein sequence

MGKIHGGVVS QDNNYSQGPV PLAARKGVIP LTFVMLGLTF FSASMWTGGT LGTGLSYNDF 
FLAVLFGNLL LGIYTAFLGY IGAKTGLSTH LLARYSFGVK GSWLPSLLLG GTQVGWFGVG 
VAMFAIPVSK ATGIDANILI AVSGLLMTLT IFFGISALTI LSIIAVPAIV ILGSYSVWLA 
VSGVGGLEHL KTIVPQTPLD FSSALALVVG SFVSAGTLTA DFVRFGRHAK SAVLIAMVAF 
FLGNSLMFIF GAAGAAAVGQ ADISDVMIAQ GLLLPAIVVL GLNIWTTNDN ALYASGLGFA 
NITGLSSRTL SVVNGIIGTV CALWLYNNFV GWLTFLSSAI PPIGGVIIAD YLLNRRRYAD 
FNTVRFIPVN WIAILSVALG IAAGHYVPGI VPVNAVLGGV FSYILLNPLF NRSLAKSPEV 
SHAEQ