Gene Ent638_2951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2951
Symbol
ID	5111984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3202627
End bp	3203640
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	52%
IMG OID	640493145
Product	thiosulfate transporter subunit
Protein accession	YP_001177666
Protein GI	146312592
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4150] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.339938
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCATTA CCGTACTGAA AAAAAGCACT TTGGCCATGG CGGGCTTATT GCTGATGGGG 
CAGGCGCAGG CCACTGAGTT GCTCAATAGC TCCTATGATG TCTCGCGCGA GCTTTTTGCG 
GCCCTGAACC CACCGTTTGA ACAGCAGTGG GCGAAAGAGA ATAACGGCGA CAAGCTGACC 
ATCAAACAAT CTCACGCCGG TTCTTCAAAA CAGGCGCTGG CGATTTTGCA GGGTCTGAAA 
GCCGATGTGG TGACGTACAA CCAGATTACC GACGTGCAGA TCCTACATGA CAAAGGTAAC 
CTGATCCCAG CGAACTGGCA GAGCCGTTTG CCGAATAACA GCTCGCCGTT CTACTCCACC 
ATGGGCTTCC TGGTGCGTAA GGGTAACCCG AAAAATATTC ATAGCTGGAA TGATCTGGTG 
CGTCCTGATG TGAAGCTGAT TTTCCCGAAT CCAAAAACGT CCGGTAACGC GCGCTATACC 
TATCTGGCAG CATGGGGTGC AGCGGACAAA GCGGACGGTG GTGACAAAGC CAAAACCGAA 
CAGTTTATGA CGCAGTTCCT GAAAAACGTC GAAGTGTTTG ATACCGGTGG TCGCGGGGCG 
ACAACCACAT TCGCAGAGCG CGGTCTGGGC GATGTGCTGA TCAGTTTCGA ATCGGAAGTG 
AACAACATCC GCAAACAGTA TGAAGCGCAG GGTTTCGAGG TGGTGATTCC TGAGACCAAT 
ATTCTGGCGG AGTTCCCGGT TGCCTGGGTT GATAAAAATG TCAAAGCCAA CGGGACCGAA 
AAGGCTGCGA AGGATTACCT GAATTTCCTT TACAGCCCGC AGGCGCAAAC CATCATCACC 
GATTACTACT ATCGCGTGAA CAATCCGGAC GTGATGAACA AACTGAAAGA TAAATTCCCG 
CAGACAGAGC TGTTCCGCGT GGAAGACAAG TTTGGCTCGT GGCCGGAAGT GATGAAAACG 
CATTTTGTCA CCGGCGGTGA GTTAGACAAA CTGCTGGCGG CGGGGCGTAA GTAA

Protein sequence

MVITVLKKST LAMAGLLLMG QAQATELLNS SYDVSRELFA ALNPPFEQQW AKENNGDKLT 
IKQSHAGSSK QALAILQGLK ADVVTYNQIT DVQILHDKGN LIPANWQSRL PNNSSPFYST 
MGFLVRKGNP KNIHSWNDLV RPDVKLIFPN PKTSGNARYT YLAAWGAADK ADGGDKAKTE 
QFMTQFLKNV EVFDTGGRGA TTTFAERGLG DVLISFESEV NNIRKQYEAQ GFEVVIPETN 
ILAEFPVAWV DKNVKANGTE KAAKDYLNFL YSPQAQTIIT DYYYRVNNPD VMNKLKDKFP 
QTELFRVEDK FGSWPEVMKT HFVTGGELDK LLAAGRK