Gene Athe_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0109
Symbol
ID	7408471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	132624
End bp	133883
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	34%
IMG OID	643714517
Product	protein of unknown function DUF214
Protein accession	YP_002572040
Protein GI	222528158
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTTT CAGACATACT TTCTTTGATT GTGACAAACA TAAAAAGAAG AAAACTTCGT 
ACTGCGCTTA CCGTTATGGG AATATTTATT GGAAGTTTGG GACTTTTTGT TGTTGTGTCA 
ATCAGTACAT CTTTTAAGGA TTATATAGTA AAAGGCATTT CAAGCTTGGG AAATGCTGAT 
GTCATATATG TTATGCCTAA CACCAATGCA GGGTATACTC TTGAAAAGTT GAAAACTGAA 
ATTCACGACA AAGACATAAA AAAACTTGAA AAACTCAGAC ATGTAAAGTT TGTCATTCCT 
TTTTATTTTA CTAATGGAAA CCTGAAATTT AAGAAATTTG AAGGCACAGT AACACTTGTT 
GCAACATCTG TCAAAGAATT TTCAAAAAAA TACACTCTGC AGTTTGGCAG GTTCCCGAAA 
GATGATAATG AAAGCGGATG CATACTTGGT TATGGGATTG CAAAACTGAT TGCCAATCCT 
TCTAAAGGAG GTTTTGCAGA TGAAAATGAG GTTAAAAAGC TTGTGAACAA GGCTATAAAG 
ATTGAGAGCA AAAGAATCAA TCAGGCAGGT GAAGAAGAAA CAAAAGAGTT TTCATTTAAA 
ATAAGAGGAA TTGCAAAGAG TGATTTTAAT TTTGATTCTT CTATAATTCT GCCAATGAAA 
GCTATGGATA AGATTGAAGA CTGGAGATAT TCTCAGCAGG ATTTTATCAA AAAGACTGGA 
TATACCTATA CATTTTTAGT TGTAGACAGT CCTTCGCACA TACCTGAGGT GGAAAAATTC 
TTAGAAAGAG AAAAATACTA CTATACCTCA ATCAAAGAAC AGCAAGAGGT TATCGAAAAG 
TTTTTAAATG CGGTAAAAAT CATAGTTGGC GGAATTGGAG CAATATCACT GGTTGTTGCA 
GCTTTTGGTA TTGCAAATAC AATGATAATG GCAATTTTAG AGAGGCGAAA AGAAATTGGG 
ATATTTAAAG TATTAGGTGC AAGTTCTAAA AACATCTTGC TTTTGTTTCT TTTTGAATCA 
GGCTTTCTGG GTTTTTTGGG CGGTGTTTTT TCTGTAATAG CTGGATTTGC ATTGAATTTT 
TTGATAGGTC TTGTGCTAAG GGCACGCTTC CCAGCCATAA ACGACTTTAG TATCGGTTTT 
AACATTCCAC TTGCCTTGTT TGTTTTATGC ATTTCAACCC TAGTTGGCAT TATTGCCGGG 
ATTTACCCTG CTAAAAAAGC AGTCTCGATT GAAGTAATCT CTGCATTGAA AGAAGAATAA

Protein sequence

MKFSDILSLI VTNIKRRKLR TALTVMGIFI GSLGLFVVVS ISTSFKDYIV KGISSLGNAD 
VIYVMPNTNA GYTLEKLKTE IHDKDIKKLE KLRHVKFVIP FYFTNGNLKF KKFEGTVTLV 
ATSVKEFSKK YTLQFGRFPK DDNESGCILG YGIAKLIANP SKGGFADENE VKKLVNKAIK 
IESKRINQAG EEETKEFSFK IRGIAKSDFN FDSSIILPMK AMDKIEDWRY SQQDFIKKTG 
YTYTFLVVDS PSHIPEVEKF LEREKYYYTS IKEQQEVIEK FLNAVKIIVG GIGAISLVVA 
AFGIANTMIM AILERRKEIG IFKVLGASSK NILLLFLFES GFLGFLGGVF SVIAGFALNF 
LIGLVLRARF PAINDFSIGF NIPLALFVLC ISTLVGIIAG IYPAKKAVSI EVISALKEE