Gene Teth514_1497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_1497
Symbol
ID	5876477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	+
Start bp	1528750
End bp	1529805
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	31%
IMG OID	641541845
Product	aminodeoxychorismate lyase
Protein accession	YP_001663120
Protein GI	167040135
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATG TCGAATACAA AAGAAAAAGT AGATTTGTGG TAATTGTAGT TGTCATAATT 
TTTTTGTTTT TTTCTGCTTT TATATATTAC CAAAGCCTTT TTCAACCTGT AACTACAAAG 
AGTGATGTAG TTGAAAAAAT AATATACATC CCTAATGGCT ATTCTACTTC CCAGATAGCT 
AAGTTGTTAA AAGAAAATAA TTTAATTAGA AACGAACGAT TTTTTATATG GAGAGCAAAA 
GTTTTAGGTG CTGATGGAAA ATTACAAGCC GGAAAATATC TCTTAAGTCC TAACATGACT 
ACTGACCAAA TAATAAAAAA AATATTTGCT GGTAAGGCTC AAATTGATAC TGTGAAAGTT 
ACGATTCCTG AAGGGTATAC ATTAAAAGAC ATAGCCACCA AATTATCCCG ATTAGGTTTA 
GTAAATAAAG ACAAATTTTT AGAAATAGCT CAAAATGACA CATTTGACTA TGACTTTTTA 
AAAGATGTTC CTAAAGATAG GCCAAACAGG TTAGAGGGAT ATCTTTTTCC TGACACCTAT 
TTTATACCTG TAAATGCAGA TGAAAAAGAA ATAATAAATA TCATGCTTAA GAGATTTCAA 
GAAGTTTATA ATAGTACTAT AAAAAATAAT GCAAAAAATG TAGGAATGAC TCCTGATCAG 
ATTGTAATAA TAGCTTCTAT AGTGGAGAAA GAGGCAGCTA TTGACAGTGA TAGACCTATG 
ATTGCGGGTG TAATATATAA TAGACTGAAA AAAAATATGA AACTTCAATT ATGTCCTACT 
GTTGTATACG CATTAGGAAT TCATAAAGAT GTGCTTTCTT ACAAGGATTT GCAGGTAGAT 
TCCCCTTATA ATACCTACCA ACATTATGGG TTGCCTATAG GTCCCATTTG CAATCCTGGA 
CTTAAATCGA TTGAAGCAGC TCTTTTCCCA ACAAAGCATG ACTTTTACTA TTATGTTGCA 
AAGAAAGATG GGTCCCATAT TTTTAGTATA ACTTATGAAG AGCATTTAAA AGCTCAGAAA 
GAAATTGAAG CAATTGAAAA TAATAATACT AAATGA

Protein sequence

MNNVEYKRKS RFVVIVVVII FLFFSAFIYY QSLFQPVTTK SDVVEKIIYI PNGYSTSQIA 
KLLKENNLIR NERFFIWRAK VLGADGKLQA GKYLLSPNMT TDQIIKKIFA GKAQIDTVKV 
TIPEGYTLKD IATKLSRLGL VNKDKFLEIA QNDTFDYDFL KDVPKDRPNR LEGYLFPDTY 
FIPVNADEKE IINIMLKRFQ EVYNSTIKNN AKNVGMTPDQ IVIIASIVEK EAAIDSDRPM 
IAGVIYNRLK KNMKLQLCPT VVYALGIHKD VLSYKDLQVD SPYNTYQHYG LPIGPICNPG 
LKSIEAALFP TKHDFYYYVA KKDGSHIFSI TYEEHLKAQK EIEAIENNNT K