Gene Spro_4566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4566
Symbol	tauA
ID	5606991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	5040562
End bp	5041557
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	59%
IMG OID	640940132
Product	taurine transporter substrate binding subunit
Protein accession	YP_001480787
Protein GI	157372798
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4521] ABC-type taurine transport system, periplasmic component
TIGRFAM ID	[TIGR01729] taurine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGCA AACACTTTTC ATTACGCGGC GCGGCACTGC TGGTGTTATC ACTTGCTGCG 
GCTAACGCCT ATGCGGTGGA CGTGACCGTG GCGTACCAGA CTTCGGCGGA ACCCGCCAAG 
GTGGCGCAGG CGGAAAACAG CTTCGCCAAA CAGTCTGGTG CCACCGTTGA CTGGCGTAAA 
TTCGACAGCG GCTCCAGCGT GCTGCGTGCT TTGGCCTCCG GTGACGTGCA GATCGGTAAT 
ATCGGTTCCA GCCCACTGGC GGTGGCCGCC AGCCAAAAAC TCCCTATCGA AGTCTTCCTG 
ATCGCCTCCC AGCTCGGCAG CTCCGAAGCC CTGGTGGTGA AGAAAGAGAT CAAAACCCCG 
CAGGATTTGA TCGGCAAGCG AATCGCCGTG CCCTTTATCT CAACCACTCA CTACAGCCTG 
CTAGCCTCGC TCAAGCACTG GGGCATCAAG CCTGAGCAGG TCAAAATTCT CAATCTGCAA 
CCGCCGGCCA TTGCCGCTGC CTGGCAGCGC GGTGACATCG ACGGAGCCTA CGTCTGGGCG 
CCGGTAGTCA ATGAATTAGC CAAGCAGGGC AAGGTACTGA CCGATTCCGC CCAGGTTGGA 
CAATGGGGCG CGCCGACGCT TGACGTCTGG GTGGTGCGCA AGGACTTTGC CGAAAAACAC 
CCGGAAGTGG TGACCGCCTT TGCCGCCAGC GCGTTGAACG CCCAAAAAGC CTATCTGGCG 
CAGCCGGATC AGTGGCTGAA GGATAAAGGC AATCTCAACA CGCTGTCCCG TTTGAGCGGC 
GTGCCGGAAG AACAGATACC GGTGCTGGTG AAGGGCAATA CCTATTTGCC GGTGGCGGAG 
CAAATAACCC AACTTGGCCA GCCGGTGGAC AAGGCTATCC GCGATACCGC CGAGTTCCTT 
AAACAGCAGG GCAAAATTCC GCAGGTCGAC GGTGATTACA GTGCCTACGT CACCGATCGC 
TTTGTGAAAC AGGTGCAGGC TGCGCCGCAG TCGTAA

Protein sequence

MASKHFSLRG AALLVLSLAA ANAYAVDVTV AYQTSAEPAK VAQAENSFAK QSGATVDWRK 
FDSGSSVLRA LASGDVQIGN IGSSPLAVAA SQKLPIEVFL IASQLGSSEA LVVKKEIKTP 
QDLIGKRIAV PFISTTHYSL LASLKHWGIK PEQVKILNLQ PPAIAAAWQR GDIDGAYVWA 
PVVNELAKQG KVLTDSAQVG QWGAPTLDVW VVRKDFAEKH PEVVTAFAAS ALNAQKAYLA 
QPDQWLKDKG NLNTLSRLSG VPEEQIPVLV KGNTYLPVAE QITQLGQPVD KAIRDTAEFL 
KQQGKIPQVD GDYSAYVTDR FVKQVQAAPQ S