Gene Athe_0250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0250
Symbol
ID	7407567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	300839
End bp	302107
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	36%
IMG OID	643714650
Product	hypothetical protein
Protein accession	YP_002572173
Protein GI	222528291
COG category
COG ID
TIGRFAM ID	[TIGR02679] conserved hypothetical protein TIGR02679

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAG ATAAGATTTT CGATGAGTGT GTAGAGTACT TTTCAAAGCC AGGATTTAAG 
CGTGCGCTGA AGCTTATTCA TAGTAAGTAT AGGTCTTTGG GGCGATTTTC TGGCAAGATT 
ATTTTAGAAA ATCCATCTGA AGAGGAAAAA GAGACTTTAT CGCGGTATCT TAGAAGGGTT 
TTGAGAGGCG AGAAGGTTGT CATTGATGTA AAAGACTTTA CCGTGACAAA GTTTCAGGAC 
ACTAAGTTCT CAGGGCTTGA TTTTAAAAGC ATTCTGTCAG CAGTTTTGAG AAAAGAGGTT 
ATCACCAAAA AAGAAGAAAA GGAGTTGAAA AGTGGAAGGA TATTAAAGTT TTTTAAAAGT 
TTGTCAGCAC ATTTTGAGGG TGATGAAAAT GCTGCAGAGG TTTTAAATGC TTTTAAAGAG 
AATTTCAAAT CATTTGAGAG CTTTTATAAA AAGTATTCAC AAGAAGAGTT TTTAGAGATA 
ATGAAAAAGG TCATAGAAGC AATTTTAAAA AAACCACAAA GCCCTGAGAC TTTGGCTATT 
TTTGCAACAA GGGTTACAGG CAACCCTCAC TTTTTTGATG ATGAGCAAGA TGCAGGAAAG 
ATATTTTTAA AGCTTTTGAG CATTATAAAC GGTAGAGAGT TTCCCCAAAA TGCAGAGGAA 
AAATCAGAAC TACTTTTTGG TAACAACATC TTAATTGATG AACTTTCAAA CTGGTGCCTT 
TTGTATAACA TTGGCGGGTA TATTGAAGAT GGAAAAGAAG ATGAAGGGCT CAAGTACTTT 
AGCAATCAAA AAAAGCCTAT TATCTTACCA CTTTATACTA TAAAGGATTA TAAAGGATTT 
TTTGCATACT CAAATAAGCT TGTGGTTGTT GAAAACCCTG CTGTATTTTC TGCGATTGTG 
CAAAGAGTCC CAGCTATTTC TGCTGTGTGC ACAAATGGGC ACCTGAGGCT CTCAAGCAAG 
ATAATCATTG GAAGCATTGC AAAGACAAAT ATATCTTTGC TGTACTCAGG CGACTTTGAC 
CCAGAAGGGC TTTTGATTGC AGACAGAGTA ATTCAAAACT TTGGTGCAAT GCCACTTTGT 
ATGGATGAAG TCCACTATTT TTTGGCACTG TCTGAAAATA AGATAGATGA AAGGCGCTTA 
GAGATGTTAA AGAATGTAAA AAGTGCTCAG CTACAAAGCG TCTGCAAGAA AATGAAGGAG 
CTTCAGCTTG CTGGGTATCA GGAGAGGATT GTGGATAGGA TTGTTGAGAA GCTAAAAGTT 
AATATTTAA

Protein sequence

MTKDKIFDEC VEYFSKPGFK RALKLIHSKY RSLGRFSGKI ILENPSEEEK ETLSRYLRRV 
LRGEKVVIDV KDFTVTKFQD TKFSGLDFKS ILSAVLRKEV ITKKEEKELK SGRILKFFKS 
LSAHFEGDEN AAEVLNAFKE NFKSFESFYK KYSQEEFLEI MKKVIEAILK KPQSPETLAI 
FATRVTGNPH FFDDEQDAGK IFLKLLSIIN GREFPQNAEE KSELLFGNNI LIDELSNWCL 
LYNIGGYIED GKEDEGLKYF SNQKKPIILP LYTIKDYKGF FAYSNKLVVV ENPAVFSAIV 
QRVPAISAVC TNGHLRLSSK IIIGSIAKTN ISLLYSGDFD PEGLLIADRV IQNFGAMPLC 
MDEVHYFLAL SENKIDERRL EMLKNVKSAQ LQSVCKKMKE LQLAGYQERI VDRIVEKLKV 
NI