Gene Athe_1466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1466
Symbol
ID	7408125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1549734
End bp	1550828
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	32%
IMG OID	643715829
Product	hypothetical protein
Protein accession	YP_002573337
Protein GI	222529455
COG category	[S] Function unknown
COG ID	[COG3581] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA TAACATTTCC ACATATGGGT AATCTATTTA TCATAGGCAA AGCACTTTTT 
GAAGAACTTG GATTTGAAGT GGTCATTCCT CCATATAACA ACAAAAGTGC TCTTGAAATT 
GGAAAGAGAC TTTCACCCGA ATTTATTTGT CTACCTTTTA AATTGAACAT GGGAAATTTC 
ATTCAAGCAA TTGAAATGGG TGCTAACACT ATTGTAATTT TTGGTGGATG TGGACCGTGT 
AGATTTGGAT ACTATGGTGC ACTTGAAAAA GAGATTCTCA AAGATTTGGG CTATGATGTA 
GAGATGATAG TCATCGAACC TCTTTTTTAT GGTTTTAGGA ATTTTTTGGA GCGGGTAAGT 
AAGATATTTG CAAGAAAAAA TATAGCCAGT GTATTAAAAA GAGTGTATAG GTTAGCCAAA 
AAGGTAGATG GGATTGAGAA AAAAGTACAT TTTTTAAGAC CAAGGGAAAT GGTTAAGGGA 
AGTGTAGATA AAATATATGA AAAATTCAGA AATGAAGCAA TAAAAGTTTT CGGAATTGAT 
CAAATGGAAA GATTGGTTGA TACCACGAAT GTTTTGCTTG ACAACTTATA CATTGTAAAT 
GAGAAGGTCA GAAAAATAGG AATTGTAGGA GAAATATATA CTATTATCGA TAGTTTTTCA 
AGCTTGAACA TAGAAAAAAT ACTTGGTGAG ATGGGATGTG AGGTTGAAAG AAATCTTTAT 
ATTTCCCAGT GGATTGATAC ACATCTAATA TATCCAATAT TTAAAAGGGA AGATCCAATT 
GTTAAGAGAT ATTCTAAAGA TGTAATGCCA GTTTTAATTG GAGGTCACGC ACGAGAGACC 
ATTTCTTATG CCAAATACTA TGCAACCCAG AAATATGATG GAATATTGCA TATTTTTCCT 
CTCACATGTA TGCCAGAAAT AATAGCAAAA TCAGTATTAA ACGGTATAAA AAATCAAATA 
AATATTCCTA TACTACACGT TGTAGTAGAC GAAGTTGACA GTGACGTAGG AATTAAAACA 
CGTTTAGAAG CCTTTTTAGA CCTAATTGAA GCAAGGAGTG AGAAATTTGA AAGAAGAGTT 
ATTTCTTGGG ATTGA

Protein sequence

MRKITFPHMG NLFIIGKALF EELGFEVVIP PYNNKSALEI GKRLSPEFIC LPFKLNMGNF 
IQAIEMGANT IVIFGGCGPC RFGYYGALEK EILKDLGYDV EMIVIEPLFY GFRNFLERVS 
KIFARKNIAS VLKRVYRLAK KVDGIEKKVH FLRPREMVKG SVDKIYEKFR NEAIKVFGID 
QMERLVDTTN VLLDNLYIVN EKVRKIGIVG EIYTIIDSFS SLNIEKILGE MGCEVERNLY 
ISQWIDTHLI YPIFKREDPI VKRYSKDVMP VLIGGHARET ISYAKYYATQ KYDGILHIFP 
LTCMPEIIAK SVLNGIKNQI NIPILHVVVD EVDSDVGIKT RLEAFLDLIE ARSEKFERRV 
ISWD