Gene Athe_1292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1292
Symbol
ID	7408873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1383225
End bp	1384556
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	37%
IMG OID	643715657
Product	Fe-S cluster domain protein
Protein accession	YP_002573165
Protein GI	222529283
COG category	[R] General function prediction only
COG ID	[COG4624] Iron only hydrogenase large subunit, C-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATT TACATTCTAT AATGCTTGAC AAAGAAAAAT GTAAAGGATG TACAAACTGT 
ATTAAAAGAT GTCCAACTGA AGCCATTAGA GTTCGAAACT CAAAAGCAAG GATTATTGAC 
CAAAGGTGCA TAGACTGCGG AGAATGCATA AGGACATGCC CGTACCATGC GAAATATGCC 
ATTACTGACA GTTTAGAGGA AATCAATAAA TTTCAATATA AAGTTGCACT GCCAGCCCCT 
TCGTTTTACG CTCAGTTTGA GGTTGATGAT GTGAATAAGC TTCTGTATGC TTTGCTTAAC 
CTTGGGTTTG ATGATATATT TGAGGTAGCA AAAGCAGCTG AGATAGTAAC CCACTTTACA 
AAGCAGTTTA TTCTTTCTGA TAAAAACAAA AAACCAGTAA TTTCCTCTGC ATGCCCAGCA 
GTTGTAAGGC TTATTCAAAC AAAATTTCCG GACTTAATCG AGAATATTCT GCCAATTGCT 
TCACCTATGG AAGTTGCTGC ATATATTGCT AAGAAAAAGA TACATAAAGA AAAAGGAATT 
GATGAAGACA AAATAGGCGC TTTTTTTATA TCTCCATGTG CAGCAAAGAT GACATATATA 
AATAATCCTC TTGGTTTTGA GCGTTCATAC GTGGATGGAG TAATAGCGAT AAAAGATATT 
TATGGACTTG TAAGAAGTAA GCTAAGAGAA ATAAAAGTTA TAAAGCCTCT TTCAATTACC 
TCAGGCAAAG GTATTGGATG GGCAGCATCA GGTGGCGAAA GCTTGGCGTT GGAAATTGAA 
GAGTATATAA ACGTTGATGG TATTCACAAC GTAGTTAAAG TTTTAGAAGA GATTGAAAAT 
GGCAGGCTCA AAGACATCAC ATATTTTGAA GGTCTTGCTT GCACTGGTGG GTGTGTTGGA 
GGGCCTCTTG CAGTAGAAAA TCCGTATGTT GCCAAAAATC GTATTAAAAG ATTGTCTTCC 
AAATTAAAAG ACAAAGAAGA GAGTCTTTCA GCGTGGACAG CGGAAATTAT TAATAGTTTT 
TCTCTCAGGC TTGAGGATGT TCTTTTTGAA AAAGAGTTGG AGACAAATCC TGTGCTTGAA 
CTTGACTCTG ATATTGAAAG AGCTATAGAA AAGTTTGAAA AGGCAAATAA TATCCTAAGT 
ATACTTCCGG GTTTGGACTG TGGTGCTTGT GGTTCACCTA CATGCAAAAC TCTTGCCGAG 
GATATAGTGC GTGGTTTTGC CAATGATACA GATTGTATTT TTATTCTCAG AGAAAGCATA 
AAAGAGCTCG CAAACAAGAT GGTTGAGCTT TCAAATAAAC TACCACCATC ACTTGAAAGG 
AATGATGAGT AG

Protein sequence

MKNLHSIMLD KEKCKGCTNC IKRCPTEAIR VRNSKARIID QRCIDCGECI RTCPYHAKYA 
ITDSLEEINK FQYKVALPAP SFYAQFEVDD VNKLLYALLN LGFDDIFEVA KAAEIVTHFT 
KQFILSDKNK KPVISSACPA VVRLIQTKFP DLIENILPIA SPMEVAAYIA KKKIHKEKGI 
DEDKIGAFFI SPCAAKMTYI NNPLGFERSY VDGVIAIKDI YGLVRSKLRE IKVIKPLSIT 
SGKGIGWAAS GGESLALEIE EYINVDGIHN VVKVLEEIEN GRLKDITYFE GLACTGGCVG 
GPLAVENPYV AKNRIKRLSS KLKDKEESLS AWTAEIINSF SLRLEDVLFE KELETNPVLE 
LDSDIERAIE KFEKANNILS ILPGLDCGAC GSPTCKTLAE DIVRGFANDT DCIFILRESI 
KELANKMVEL SNKLPPSLER NDE