Gene Tbis_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbis_2044
Symbol
ID	9168538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobispora bispora DSM 43833
Kingdom	Bacteria
Replicon accession	NC_014165
Strand	-
Start bp	2368972
End bp	2370129
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	68%
IMG OID
Product	aminodeoxychorismate lyase
Protein accession	YP_003652649
Protein GI	296270017
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0389257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACG TTGACTTGGA CTTCCTCCTC GGGGATGCGG AGGACGAACG CCCGTCCCGG 
CGTCGTCCCC CCGGGAGCCG GGTACAGCAG CGCCGGAGCC GCAAGCGGCG CAGGCGGCAG 
CGCCGGAAGG GGTACATCGC GACCGTCTTC GCCATGCTCG TCATCGTCGG CGTCCTCGGC 
GGTGGCGTGT ACTACGGCGT CAACGTGGCG CGCGAGGTGC TGACCCCCAA GGACTTCACC 
GGCGAGGGGC ATGGCGAGGT GGAGGTCGAG GTCAAGGAAG GGGCGACCGC GACCGACGTC 
GCGCAGCTCC TGGAGAAGGA GGGCGTCGTG GCGAGCGCCC GGACGTTCCT CAACGTGATC 
GGCGCCGCGG GCAAGACCTC CTCGCTCCAG CCCGGCGTGT ACACGCTGCG CAAGGGCATG 
TCGGCCGAGG CGGCCCTCAA AGCGATGCTC GACCCGGGCA ACAAGGTGGT CAACCGGGTC 
ACCATCCGGG AAGGGCTGCG GCTGAGCAAG ATCTTCACCG AGCTCTCCAC GGCCACCGGC 
AGGCCGGTCG AGGAGTTCCA GAAGGCGGCC AAGGAGGACA TCGGCCTCCC GTCGTACGCC 
AAGGGCCGGC TCGAGGGCTT CGCCTTCCCG GCGACCTATG ACATCAGCCC CAAGGACACC 
CCCAAGACGA TCCTCTCCCG GATGGTCGAG CGGTTCGTGC AGACCGCGGA GCGCCTCGAT 
CTCGAGCGGC GGGCCAAGGA GCTCGGCTAC ACGCCCCGGC AGATAATGAT CATCGCGAGC 
ATCGTCCAGG CCGAGTCCGG ACGGCTCGAG GACATGCCGA AGGTCGCCCG GGTGATCTAC 
AACCGGCTGA GCCGGAACCC GCCGATGAAG CTGGAGATGG ACAGCACCCT CATGTACGGG 
CTCGGCAAGT ACGGCATCGC CGCCACCAAC GAGGACCTCA AAAGCGACAG CCCGTACAAC 
ACCTACCGGC GGTACGGCCT GCCCCCGGGC CCGATCTGCA ACCCCGGCGA CCACGCGATC 
GAGGCCGCGC TCAATCCCGC CGACGGCAAC TGGCTGTGGT TCGTGACCGT GGACCCGAAG 
CGCGGCATCA CCAAGTTCAC CGACAAGGAG TCGGAGTTTT GGAAGCTTCG CGAGGAGTTC 
AACCGGAACC GCGGGTGA

Protein sequence

MNDVDLDFLL GDAEDERPSR RRPPGSRVQQ RRSRKRRRRQ RRKGYIATVF AMLVIVGVLG 
GGVYYGVNVA REVLTPKDFT GEGHGEVEVE VKEGATATDV AQLLEKEGVV ASARTFLNVI 
GAAGKTSSLQ PGVYTLRKGM SAEAALKAML DPGNKVVNRV TIREGLRLSK IFTELSTATG 
RPVEEFQKAA KEDIGLPSYA KGRLEGFAFP ATYDISPKDT PKTILSRMVE RFVQTAERLD 
LERRAKELGY TPRQIMIIAS IVQAESGRLE DMPKVARVIY NRLSRNPPMK LEMDSTLMYG 
LGKYGIAATN EDLKSDSPYN TYRRYGLPPG PICNPGDHAI EAALNPADGN WLWFVTVDPK 
RGITKFTDKE SEFWKLREEF NRNRG