Gene Athe_1970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1970
Symbol
ID	7407384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2081954
End bp	2082994
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	33%
IMG OID	643716342
Product	Radical SAM domain protein
Protein accession	YP_002573830
Protein GI	222529948
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTGTA ATGTACCTAA ACCGTTAATA ATGTCAATCG ATGTTACCTA CAAGTGTACG 
ATGAGGTGTT TACATTGTTT CAACGGAAGT AATGAAAATG AATTAGAACC AGAATTAACA 
GATGAAGAAT TACTTTATTT AGCAGATCAA ATTGTTGATA TAATGCCCAA TGTCATTTGT 
TTTTGTGGTG GTGAACCACT TATTAGAAGA GAAATTCTCT ATTTGTGTTG TGAAAAAATA 
GTCAAGAGAA CAAATGGATA TACAAAAGTG AATGTAGTTA CAAATGGTGA ATTAGTAAAT 
AATGAGGTAG CAAGAAATTT ACGGAAAGCC GGATTTAATC TTGTTCAGGT TAGCCTTGAT 
GGTGCAAAAC CTGAAACACA TGATTGGCTT CGAAATAAGA TAGGAAGTTT TAACAAGGCT 
GTCAATGCTA TAAAAAGTCT TGTGGAAGCT GGGTTATACG TTGGTGTTGC TTATACACCA 
ACTTTAAAAA ATATTCCAGA AATTGATGAA GCGATAAAAT TATGCGAGCA ATTAGGTGTT 
TGTGAATTTC GCGTTCAGCC TCTAATGGTA ATGGGAAGAG CGAAGAGAAA TTTAAATGGG 
TATATTCCAA CCTATAGAGA TTATCAAATT CTTGCAACAA AGCTAAAACA GTTACAAATG 
CAACAAATAG CAAAGAAAGG AATGAATGTA GAATGGGGAG ATCCGGTAGA TCACCTTATA 
AGATCGAACT ATAGAGAAAG TGGTTATAAT CCATTTATAG GAATAGATGC ATATGGATAT 
TTGAGAATAT CTCCTTATTT ACCATTGACT TTTGGAAATA TAAGAAGACA TACAATTTTA 
GAGTATTGGA ATAGTGGTTT GTCAAATGTT TGGAGTTTAC CAATTGTTAA GTGGATTTCG 
AAGCAAATTA GAGCTACAGA AGATTTGGAT CTTTCTTCCA AAGGATTTAA AGAGGTTTAT 
TGGGAAAAGA GTGTAGATAT TGACCTTATT GAAGATTATA TTTCAGAAGT TAAGCCAGAA 
CAATTTTTCG CAAAAAATTA G

Protein sequence

MNCNVPKPLI MSIDVTYKCT MRCLHCFNGS NENELEPELT DEELLYLADQ IVDIMPNVIC 
FCGGEPLIRR EILYLCCEKI VKRTNGYTKV NVVTNGELVN NEVARNLRKA GFNLVQVSLD 
GAKPETHDWL RNKIGSFNKA VNAIKSLVEA GLYVGVAYTP TLKNIPEIDE AIKLCEQLGV 
CEFRVQPLMV MGRAKRNLNG YIPTYRDYQI LATKLKQLQM QQIAKKGMNV EWGDPVDHLI 
RSNYRESGYN PFIGIDAYGY LRISPYLPLT FGNIRRHTIL EYWNSGLSNV WSLPIVKWIS 
KQIRATEDLD LSSKGFKEVY WEKSVDIDLI EDYISEVKPE QFFAKN