Gene Athe_2215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2215
Symbol
ID	7408412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2345364
End bp	2346356
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	36%
IMG OID	643716583
Product	ApbE family lipoprotein
Protein accession	YP_002574062
Protein GI	222530180
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0332053
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACAG CCTTGATTTC AAATGAGACA AAGATTATAA AATCAATGTT TGCACTCGGC 
ACAGACATTC ATTTTATTTT TTACCAATCA AACTTTGAAA GTGCACTTGA CAGGGCCCAC 
AGTCTCATTT TAGATATGGA AAATAAATTG TCGGTTTTCA AGCCAAAAAG TTTAGTAGCA 
AAATTAAATA GATACGGAAA TTACATCCCC ATAAAGGTTT GCCCGGAGGT TTATGAGCTT 
ATAAAAAAGT CGGTTGAGTA CAGCCTATTT TCAGAAGGTT ATTTTGATAT AACGGTAAAA 
AGACTTATAG ATATGTGGAA AGAAGCAAAA CAAAAAAATA AGATGCCGTC AAAAGAAGAA 
ATAGAACTTG CTCTCACTTT TTCAGGCTCA GAAAACATAC AGCTTTTATC AAACTATAGA 
GTAAAGCTCA AAAACAAAGT CAAACTTGAC TTTGGAGCTA TTGCCAAAGG CTTTCTTGCA 
GACAAAATAC GTGAGATTTT TGAACAGGAA GGTATAAATT CAGCAATTGT CGACCTTGGC 
GGGCATATAC TGACAGTTGG GAAAAAACAT GATGAGAGCC TTTGGAAGGT GGGAATTCGG 
CATCCTTTTA AAACAAGAGA AGATGTGCTG GGTTTTTTAG AGCTTGGTAG TACTTCAGTT 
GTAACATCCG CAAGTTATGA AAGGTATTTT ACAATTGATG GCAAAAAACT TTCACACATA 
ATCAATCCAA AAACAGGATT TCCTGTAAAA GATGACATTG CAAGTATAAC CGTTGTTGAC 
ACAAACTCAA CATTTGCAGA TGCGATGTCA ACTGCCCTTT TTGCAATGGG ATTTAAAAAG 
GCCATAAATT TCATACAGGA CAGCAAGACT ATTGAAGCAG TGGTTGCTAC TTCTTTTCGA 
GAAATATATA TAACACCAGG GCTTGCACAA AGGTTTACCC TGTGTGATAG CTCTTTCAGA 
ATTATTAAGA CAAATGAGGT GATTGTTCTG TGA

Protein sequence

MDTALISNET KIIKSMFALG TDIHFIFYQS NFESALDRAH SLILDMENKL SVFKPKSLVA 
KLNRYGNYIP IKVCPEVYEL IKKSVEYSLF SEGYFDITVK RLIDMWKEAK QKNKMPSKEE 
IELALTFSGS ENIQLLSNYR VKLKNKVKLD FGAIAKGFLA DKIREIFEQE GINSAIVDLG 
GHILTVGKKH DESLWKVGIR HPFKTREDVL GFLELGSTSV VTSASYERYF TIDGKKLSHI 
INPKTGFPVK DDIASITVVD TNSTFADAMS TALFAMGFKK AINFIQDSKT IEAVVATSFR 
EIYITPGLAQ RFTLCDSSFR IIKTNEVIVL