Gene Athe_0661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0661
Symbol
ID	7407085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	745774
End bp	746925
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	38%
IMG OID	643715042
Product	hypothetical protein
Protein accession	YP_002572558
Protein GI	222528676
COG category	[S] Function unknown
COG ID	[COG3581] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.030634
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAT CATTTCCTTA CATGGGCTCT GCCATAGTGT ATAAAAAACT TTTTGAGTTT 
TTGGAACATG AAGTGATAAT GCCGCCAAAA CCAACACAGA GGACCATGGA CCTTGGCGTC 
AAATACTCAC CAGAGTTTGC TTGCATTCCT CTTAAAATGG TCATGGGGAC ATATTTAGAG 
GCCATTGAAA AAGGTGCAAA AGTGCTTGTG ACATCTGGTG GACATGGTCC ATGCAGAGCA 
GGTTTTTATG GTGACACTCA CAGGAACATA TTAAAATCTC TTGGCTATGA CGATGTTGAG 
CTTATAATCT TTGATGCTCC ACAGGATAAC TGGAGGGCAT TTTTAAGAAA CGTTCAAAAA 
ATCAGAAATG GAGTTCCATG GCACAAGGTT ATAAACAGGA TGTACACCTT ATACAGATTT 
GTCCAGAAGC TTGATGAGCT TGAAAAGATG GTTCAAAAAA TAAGACCATA TGAAGTCAAC 
AAAGGTCAGA CAACTCAGGT TTGGAATCAA ATCCAAGAAA AGTTTGACAA AATAAAGACA 
AGAAAAGAAC TGTATAGAGT TTATGAAGAG TGCAAGCAGA TGCTTCTTAG TATCCCAACA 
AGAAAGGTTG ATGAAAAAGA CAGAATAAGA GTTGGGATTG TAGGCGAGAT TTATGTTGTG 
ATGGAAAGCT CTATTAACTT TGGGATAGAA GAGATTTTGG GCAATCTTGG GGTTGAGGTA 
GAAAGAAGCT TGTATCTTTT TGAGTGGATA AACGACAATC TGGTTCCATG GATTTTGAGA 
CCAAAGAGGT TTAAAGAGAT TATAAAAAAG GGTCAAAGAT ATATCAAGAT TTTAATTGGT 
GGTCATGCGG TTGAGACTGT GGGACATATT ATAGACTTTA AAGAGAGAGG ATTTGACGGA 
ATTGTTCATC TTATGCCCTT TGCATGTTTG CCAGAACTTG TAACCCAGAG TTTAATTCCA 
AAGATATCGA AAGAGATTGA TATTCCAATT CTGTCGCTTC CAATAGATGA GCAGACAGGA 
AAGGCAAATA TGCTCACCAG GATAGAAGCT TTCATTGACC TTTTGAGAAA TAGGAAAAGA 
GGAAAAACAA AAGAAGTCTT TATTGACAAC ATACAAGAAC ATGTTCAGGA AGAAAGGGTT 
GTAATGGTAT GA

Protein sequence

MKVSFPYMGS AIVYKKLFEF LEHEVIMPPK PTQRTMDLGV KYSPEFACIP LKMVMGTYLE 
AIEKGAKVLV TSGGHGPCRA GFYGDTHRNI LKSLGYDDVE LIIFDAPQDN WRAFLRNVQK 
IRNGVPWHKV INRMYTLYRF VQKLDELEKM VQKIRPYEVN KGQTTQVWNQ IQEKFDKIKT 
RKELYRVYEE CKQMLLSIPT RKVDEKDRIR VGIVGEIYVV MESSINFGIE EILGNLGVEV 
ERSLYLFEWI NDNLVPWILR PKRFKEIIKK GQRYIKILIG GHAVETVGHI IDFKERGFDG 
IVHLMPFACL PELVTQSLIP KISKEIDIPI LSLPIDEQTG KANMLTRIEA FIDLLRNRKR 
GKTKEVFIDN IQEHVQEERV VMV