Gene Athe_0210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0210
Symbol
ID	7407201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	257964
End bp	259094
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	38%
IMG OID	643714611
Product	dihydropteroate synthase
Protein accession	YP_002572134
Protein GI	222528252
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0294] Dihydropteroate synthase and related enzymes
TIGRFAM ID	[TIGR01496] dihydropteroate synthase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGGCTGA TATCAAAAGA TGCGAATATA AAGAGGATTT TGTATCAAAA AGGCTTTGAT 
GAGAAAGACA TTTTGGAATT TGAAAAAAAG GCAAACTCAA TAATTTTGAG ATTTGATAAC 
ATAAAAAATC CTTCAGAGTT TGTCCAGCTT CTTTCAAACC TCGGTTATTT TACAATTTCA 
AACGGCAATA TGTGCTTTGC AACAACAACA CTTTACAACT TTGAAAAGAC AAGATGCGTT 
TTGACAGAGG AAGGGATAGA GTGTAATTTT GATGCAGATT TTACCATTTC ACAAAGGTAT 
TTGCTTGCAA AAGATAAAAA ATTGAGCCTT TTGAAGACAA ACGTGATGGG GATTATAAAT 
GTTACACCAG ACTCGTTTTA TGAGGGCTCA AGAGTTCAAG TTGAAAAGGT AACCCAAAGA 
GTACTCCAGA TGATTCAAGA TGGTGCAGAT GTTCTGGACA TTGGCGGTGA GTCCACAAGA 
CCTTTTTCAG AGCCAGTTGA GGAAGAGGAG GAGCTAAAAA GAGTAATTCC TGCAATTGAA 
GCGATAAGAG ATATGGATAA AAATATCCCA ATTTCAATTG ATACATATAA AAGCAGAGTA 
GCTCAAAAAG CAATAGAGGC CGGTGCTGAC ATTATAAATG ATATTAGCGG CGGAACGTTT 
GACAAAGACA TGTTTTACGT GGCAGCGCAC TACAATGTTC CTATCATAAT TATGCACATC 
AAGGGTACGC CTAAGGATAT GCAAAAAAAC CCTTACTATG AAGATGTTAT AGAAGAGATT 
TTGCAGTTTT TTGAACTGAG GATTGAACAG GCTCTGAAAG CCGGTGTAAA ACTTGAAAAC 
ATCATCTTAG ACCCTGGCAT TGGCTTTGGG AAAAGGCTTG AAGACAACTT GGAGATACTG 
CGAAGGTGTG AAGAGTTCAA GGTTTTAGGA AGACCCATTT TGATTGGGGC ATCAAGAAAA 
TCGGTGATTG GCCATGTGCT GAGTAATCTT CCCCCTGAGG AAAGGCTTGA AGGAACTTTG 
GCAATCTCTG TAATATGTGC TCAGAAAAAG ATTGAATTTG TAAGGGTGCA TGATGTAAAA 
GAAAACAAAA GAGCCATCTT GATGACACAG GCTGTCTTTG ATGGAGTTTA A

Protein sequence

MRLISKDANI KRILYQKGFD EKDILEFEKK ANSIILRFDN IKNPSEFVQL LSNLGYFTIS 
NGNMCFATTT LYNFEKTRCV LTEEGIECNF DADFTISQRY LLAKDKKLSL LKTNVMGIIN 
VTPDSFYEGS RVQVEKVTQR VLQMIQDGAD VLDIGGESTR PFSEPVEEEE ELKRVIPAIE 
AIRDMDKNIP ISIDTYKSRV AQKAIEAGAD IINDISGGTF DKDMFYVAAH YNVPIIIMHI 
KGTPKDMQKN PYYEDVIEEI LQFFELRIEQ ALKAGVKLEN IILDPGIGFG KRLEDNLEIL 
RRCEEFKVLG RPILIGASRK SVIGHVLSNL PPEERLEGTL AISVICAQKK IEFVRVHDVK 
ENKRAILMTQ AVFDGV