Gene Athe_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0041
Symbol
ID	7407276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	53096
End bp	54550
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	38%
IMG OID	643714451
Product	hypothetical protein
Protein accession	YP_002571976
Protein GI	222528094
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGAAA GTGAAATGCA GATTTTGAGT TTTTTGAAAA AAGTGCAAAG AAGGCAGATA 
CTTTGCAGCC TCTTGACGCG TCTGTGGCAG TGTGTATCTG CTTCTTTGTC TTTTGTTATT 
TTGGTAGAAG CTTTATCAAA GATTGTCCCA ATGTACTACA AAGCTTTCTA CCAGATATTT 
ATTTTGCTGC TGTCTTTAGG CATATATGTA GTTTTTGTTA TCTCAAGGAA GCCAACTCTT 
CAGCACTCAG CACTTATAGT TGACAGTTTT GGCTTGAAAG AAAGGCTGAC AACATCATTG 
GAACTCATTG GCGTTGATAC CGAAATCTCA AGATATATAA AGCAAACAAC GGCACAGATT 
ATAAAAAATA TAGACATAAA AAAACTGATA AAACCTAAGC TTGAAAAAAA TAAATGGATG 
TTTGTAGCAT CACTTTTCAT TGTATTTTTC ATTTTAACAA ATGTTCAAAG TCCTAAAATG 
GATGAGGCAA AAAGATTACA TCTTCTGAGC AGCCTTAAGA AAAAGGAAAT ACTCAAGATA 
GAAAAGCAGA AAAAAGAGGT GCTAAAAAGT TACAAGCTTA ATGAGGTTGA AAAGAGAAAG 
ATTGATGAAG TATTGTCAAA ACTTAAAAAG GAAATAAAAC TTGCCAAAAC CAAAAGCGAA 
ATAGAACTTG CAAAGCAAAA GGCATGGTTT TTGCTCAATG ATTTGAAAAA TAGTCCTGGA 
AGCCCCCAGT TTTATTCAGC AGTGGAAAAG TTCAAAAATT CTATTACACA GGACAACAAG 
TCAGCCCAAA GTGGTACAAA AAATTTTCTT GCAAATGCTA ATACAAAAAG CGACAATAAA 
AGTGGAAGCT CATCTCCCAG TTCAAATGGA CAAAGTAGTG CACAAAAGAG TGAAAATAGT 
AAGAGCATCT CTGCTTTTTC CAAAAGTGAA AACTCCCAGG ATGCAGGCAG CAGCTTGACT 
GCATCAAATG ATCAAGGACA GGCCCAGCAA GAGCAAGTGC AGTCTTCCTC TGCCGAGGCA 
AATGGAACTT CAAACGACTC AGGCTCAGGC GCAAGTGCAA ATAGTGTGCA AAATGCATCT 
GGTCAAGCTA GTGCACCTGG TGGCATGCAA GGAAGAGGTG AAGGGATAAG CCAAGTTGAT 
AATTTAAATA ACAAAGGCAA AGGGCTTGGT GCAGCCATTC CCAGAACTTC AAATAAAGTA 
CAGATGCCTT CCATTTATAC AAAAAATCTT CTAAGCCTTG ATGCATCTAA AAAGGTTTTG 
GCGGACATAG GACAGGAAAG TGGAAGAGTA TCCCAAAAAC AGGGCATTGG AGAAAGAGGG 
CAGAAACTGA GTTTTGACAG GGTTTTTTCA CAATACAAAC AGGAGGCAAA TGAATATATC 
GAAGCAGATG AAGTTCCTTT ATGGGCAAAG GAAATAACCA AACGGTATTT TGAAAATTTA 
GAGAACATGA GGTGA

Protein sequence

MHESEMQILS FLKKVQRRQI LCSLLTRLWQ CVSASLSFVI LVEALSKIVP MYYKAFYQIF 
ILLLSLGIYV VFVISRKPTL QHSALIVDSF GLKERLTTSL ELIGVDTEIS RYIKQTTAQI 
IKNIDIKKLI KPKLEKNKWM FVASLFIVFF ILTNVQSPKM DEAKRLHLLS SLKKKEILKI 
EKQKKEVLKS YKLNEVEKRK IDEVLSKLKK EIKLAKTKSE IELAKQKAWF LLNDLKNSPG 
SPQFYSAVEK FKNSITQDNK SAQSGTKNFL ANANTKSDNK SGSSSPSSNG QSSAQKSENS 
KSISAFSKSE NSQDAGSSLT ASNDQGQAQQ EQVQSSSAEA NGTSNDSGSG ASANSVQNAS 
GQASAPGGMQ GRGEGISQVD NLNNKGKGLG AAIPRTSNKV QMPSIYTKNL LSLDASKKVL 
ADIGQESGRV SQKQGIGERG QKLSFDRVFS QYKQEANEYI EADEVPLWAK EITKRYFENL 
ENMR