Gene Ent638_0838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_0838
Symbol	tauA
ID	5111186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	935781
End bp	936743
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	58%
IMG OID	640491014
Product	taurine transporter substrate binding subunit
Protein accession	YP_001175573
Protein GI	146310499
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4521] ABC-type taurine transport system, periplasmic component
TIGRFAM ID	[TIGR01729] taurine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.467754
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTT CATCGCGTAT CACACTACTC GGCGCTCTGG CGCTGTGGGC ATTTCAGGCG 
CAGGCGGTTG ATGTCACCGT CGCGTATCAA ACTTCCGCGG AACCGGCGAA AGTCGCGCAG 
GCGGATGGGA CGTTTGCGAA AGAAAGCGGC GCGAAAGTGG ACTGGCGTAA GTTCGACAGC 
GGCGCAAGTA TTGTGCGGGC ATTGGCGTCC GGCGATGTGC AGATCGGGAA TCTCGGCTCC 
AGCCCGCTGG CGGTTGCTGC GAGCCAGCAA GTGCCCATTG AAGTGTTTCT TCTTGCCTCG 
CAGCTCGGGA ATTCCGAAGC GCTGGTGGTG AAGAAAGGGA TCACCAAACC CGAAGATTTG 
ATCGGCAAAC GTATCGCCGT GCCGTTTATC TCGACCACCC ACTACAGCCT GCTGGCGGCG 
CTCAAACACT GGGGTATCAA GCCGGGTCAG GTGGAAATCC TTAACCTGCA ACCGCCTGCG 
ATAATTGCAG CCTGGCAGCG TGGAGATATT GATGGCGCGT ATGTCTGGGC ACCGGCGGTG 
AACGCGCTGG AAAAAGACGG CACGGTGCTG ACCGATTCCG AAAAAGTGGC AGAGTGGGGC 
GCGCCAACGC TCGACGTGTG GGTGGTGCGT AAAGACTTTG CCGAGAAACA TCCTGACGTG 
GTGAAAGCCT TTGCGAAAAG CGCCATCGAT GCGCAACAGC CCTACATTGC CAATCCCGAT 
GAATGGCTGA AACAGCCCGC CAATCTGGAA AAACTCTCGC GTCTCAGCGG CGTGCCAGAA 
GCGGATGTGC CGGGTCTGGT CAAGGGCAAT ACCTATCTGA CGCCCGCGCA GCAGGTCCAG 
CAGCTTTCTG GTCCGGTGAA TAAAGCGATT ATCGACACCG CCGGGTTCCT GAAAGAGCAG 
GGCAAAGTGC CTGCGGTGGC GGCGGATTAT AGCCAGTTCG TGACCGATCG CTTTGTGAAA 
TAA

Protein sequence

MAISSRITLL GALALWAFQA QAVDVTVAYQ TSAEPAKVAQ ADGTFAKESG AKVDWRKFDS 
GASIVRALAS GDVQIGNLGS SPLAVAASQQ VPIEVFLLAS QLGNSEALVV KKGITKPEDL 
IGKRIAVPFI STTHYSLLAA LKHWGIKPGQ VEILNLQPPA IIAAWQRGDI DGAYVWAPAV 
NALEKDGTVL TDSEKVAEWG APTLDVWVVR KDFAEKHPDV VKAFAKSAID AQQPYIANPD 
EWLKQPANLE KLSRLSGVPE ADVPGLVKGN TYLTPAQQVQ QLSGPVNKAI IDTAGFLKEQ 
GKVPAVAADY SQFVTDRFVK