Gene Athe_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1840
Symbol
ID	7408954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1915995
End bp	1917143
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	28%
IMG OID	643716217
Product	GAF domain protein
Protein accession	YP_002573706
Protein GI	222529824
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGAAC TTTATGACCA AATTTCGAAA TTACGAAATA TTCTTGAGAA ATTGAGTTCT 
TATATATTAT ATGTCTCAAC TGAAAAAAAT ATAGAGGATA TTCTCCTTCA AACCATTGAT 
ATATGTTTAG AACTTACAAC AAGTGATGGT GCCACAATTT ATCTTAAAGA AATAATAGAA 
AACGAGGAAA AACTTGTAAT CAAAGCTACA AAAAATCAAT CAGTCAATTT TGAGTTCTAC 
TTGGGATACT CACTGCCCAT AAATTCTATT AGTATAGCAG GATATGTTGC TTCTAACCGC 
AAACCTGTGA TTATAAATAA CACTTTATCT TTACTTGAAA ATCATGAATA TAGGCAATTC 
AAATTTTTTG ACAGGAGTTT GCATTATATT ACAATTAACA CTATAACAGT ACCAATTTTT 
GATTACACAA ACAGGGTTAT AGGAGTTTTG CAAGTTGTTA ATAAGAAGGC AAAACCTCAA 
TTAAAACTTG AAGAAAACAA TGCTCATCTA TTTACTATTG ACTATACTGA TAACGATGCA 
AGAATTATAT TAGCAATCTC GGCACTTTTA GGAATCATTT TAGACAGAAT TTGGCTTTAT 
CAAAAAAATG ATCAACTGAT AACAAATACT CAAAAGATGC TAAGTAATAT TTTCGACTCG 
GTAAAAAAAT CAATTTTGAC TTTAAATGAT ATAATGCTGA CAGGTCAGCA AAAGTTCATA 
GAGTATCTTC AAGCTGAGAA AAGAAAAAAA GTTCTCGAGT TTAAGGAAGG ATTTGAACTT 
TGTAAAAAAC AAATTGAACT CTCAAAAGTT ACTGAGACAA TTATAACTGT ATGTTATTTA 
TCAATTGAAA CTTCAGATAA TAAATTATCA AATATATTCT ATGAAGTACT TTCATCAGAA 
ATAAGAATAT ATGACATTCC TGTAATGGTA AAAGAAAATG AGTATGTCCT TCTACTTTAT 
AACGTCGATT TGATAAAAGC TAAAATGATT GCTAAAAGGA TAGAAAGAAA AATGATTGAA 
AAGGCAAATT CACAAAACTA TAACTTTTCA TTCAAAACCA AATGGAGTTT CTATGAAATA 
AAGCCTTCAG AAGAAAAAAC TCTTGAGGAA ATATGTGAAG GTTTAAAAAG TACTGGAGCA 
GAGCTTTAA

Protein sequence

MIELYDQISK LRNILEKLSS YILYVSTEKN IEDILLQTID ICLELTTSDG ATIYLKEIIE 
NEEKLVIKAT KNQSVNFEFY LGYSLPINSI SIAGYVASNR KPVIINNTLS LLENHEYRQF 
KFFDRSLHYI TINTITVPIF DYTNRVIGVL QVVNKKAKPQ LKLEENNAHL FTIDYTDNDA 
RIILAISALL GIILDRIWLY QKNDQLITNT QKMLSNIFDS VKKSILTLND IMLTGQQKFI 
EYLQAEKRKK VLEFKEGFEL CKKQIELSKV TETIITVCYL SIETSDNKLS NIFYEVLSSE 
IRIYDIPVMV KENEYVLLLY NVDLIKAKMI AKRIERKMIE KANSQNYNFS FKTKWSFYEI 
KPSEEKTLEE ICEGLKSTGA EL