Gene Athe_1797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1797
Symbol
ID	7408584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1869248
End bp	1870519
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	36%
IMG OID	643716174
Product	PDZ/DHR/GLGF domain protein
Protein accession	YP_002573663
Protein GI	222529781
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAGT TTTTCTGGCA GATATTTGAA CTGACAGGAC TTAGTATATT TCAACTTCTT 
TTTAGCTGGA ACTTCTGGGT GGTAGTAATC TTGATTTCTT TTTTGTACAG AAGAGAACAA 
GAATTTGAAC AGGCTGTGAT TGGACACAAC CGAGTCAGCC TTCTATACAA GGTTGTAGAG 
TCTTCTATCG CGGGACTTGT AGGAGGTTAT ATAGTTAGTT TAATTACCTT ATTTTTTGGC 
ATAGTAGTGG ATGTGGATAG TTTTATGTAT CTTTGGTATA TTGCTTTGAT TCTTGCACTA 
ATAAATCCAA GATATCTCTG TTTTTCATAT GCTGCCGGAA TTATTTCGGT GATATCTCTC 
ATCTTCAAAA AACCAATTGT TGATATCTCA GGAATATTGG TAATTGTGGC AATACTTCAT 
TTTGTTGAAA GTCTTCTAAT TTTCTTGGAT GGTTTTCGTG GGGCGATACC TGTTGTGATT 
GAGAGAAGAA AAAAAGAAGG CATTTTTTCA ACCTCAGGTG CTTATCTTAT GCAAAGGTTC 
TGGGCTATAC CGATGGTAAT AATTGCGTAT AACTATCAGA CTACCGCGCA GGTTGTCAAA 
ATTGAGCTGT TTGAACCTTC CTGGTGGCCT CTTTTCAAGC CACAGAATCT TTTGCCAAAT 
GCTATGCTTC TTATGACTCC TATTGTGGCT GCACTTGGAT ACGGAGATTT GGCGGTAGAA 
GATGAACCTG CTGTGATAAG CAAAAAAAGC GCTGGGATTT TAAGCATTTT CAGCGTTGTT 
TTGTTTGCTA TGAGCGCACT TTCATACAAG GTCTATGCTT TTAAGTGGGT GGCAGCTTTG 
TTTGCCCCAA TGGCTCATGA AGGGATTATA CTGTATCAGC AGAAGAGACA AAAAGAAGGA 
GATTCAATAT TTGAAGCAGA GGAAAATAAA ATAAAGGTGT TGTATGTCGA AGAAAATAGT 
GTAGCAGCCA AGATGGGAAT AAAACCGGGT GATGTTATTC TTTCAATAAA TGGTATTCAA 
GTTCAAAAAG AAGAGGATAT AGAAAGAATA TTTTCTGATG CACAGATTTA CCTATGGGTA 
AAAGCTATGG ACAAAAGAGG AAAGATGAAA GAGCTATATT ATCAGGACTA TGAAAATGGA 
ATAAGAAATC TTGGAATAAT TGTTATTACT AAAAATGTGA GTGCTAATTA TCAGCTTGAG 
TCTGATGGAT ATTTTATGTT TATAAAAAGT ATAGCAAGAA GAGTAAAAAA TTTTTTGTTC 
AACAGAAGCT GA

Protein sequence

MLKFFWQIFE LTGLSIFQLL FSWNFWVVVI LISFLYRREQ EFEQAVIGHN RVSLLYKVVE 
SSIAGLVGGY IVSLITLFFG IVVDVDSFMY LWYIALILAL INPRYLCFSY AAGIISVISL 
IFKKPIVDIS GILVIVAILH FVESLLIFLD GFRGAIPVVI ERRKKEGIFS TSGAYLMQRF 
WAIPMVIIAY NYQTTAQVVK IELFEPSWWP LFKPQNLLPN AMLLMTPIVA ALGYGDLAVE 
DEPAVISKKS AGILSIFSVV LFAMSALSYK VYAFKWVAAL FAPMAHEGII LYQQKRQKEG 
DSIFEAEENK IKVLYVEENS VAAKMGIKPG DVILSINGIQ VQKEEDIERI FSDAQIYLWV 
KAMDKRGKMK ELYYQDYENG IRNLGIIVIT KNVSANYQLE SDGYFMFIKS IARRVKNFLF 
NRS