Gene Athe_0138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0138
Symbol
ID	7408500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	173976
End bp	175400
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	32%
IMG OID	643714543
Product	protein of unknown function DUF324
Protein accession	YP_002572066
Protein GI	222528184
COG category	[L] Replication, recombination and repair
COG ID	[COG1337] Uncharacterized protein predicted to be involved in DNA repair (RAMP superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCAAAA TTAAAGGAAG ACTAATTTTA AAAGGAATTT TGAAAAATGA ATCGCCTTTT 
GTAATTGGTA AGGGTAAAGG GGATTTAATA GACATAGAGA TTTTAAAAGG TGAAAAGGGA 
ATGCCTTATA TTCCAGCTAC ATCATTTATT GGAGTGCTCA AACATCACAT TTGCAATGAA 
AAATTTGACA TTGAAGATGA ATATACATGG AATTATTTTT GGGGAGACAA TGTAAAAGAA 
AATGATAATG ATTCTAATAC AGGCATACAA AGTCATTTTA TGGTTAGCGA TATAAAATTG 
GAAGAAGAAC AAACTGGGAT ACTGGCTATC AGAGATGGTA TTGCTATTGA TTCAAGATAT 
GGGGTTGCCA AAGAAAAAGC AAAGTATGAT TATGAAGTAG TTAATAAAAA TCTAACATGG 
GGCTTCTGTG CAGAATTAAT TTTAAGAGAA GGAGTTAATG AAAATTTGTT TTTTAAGATA 
TTAAACACTG TTTTAAATGA ACTAAAACAG GGGCGTGTGA GAATAGGAGC TTTTACCACT 
AAGGGTTTTG GGAAATTTAG ATTAGTAGAT TGTAATGTTT ACCTATTTGT GTTCCCTAAA 
GACGGAGAAA AATATTTAAA GTTTTTAGCA GATGAGGAAA ACGCTTTAAA AGAATTAGAA 
GAGTTTGATT TAAGCGAATA TGGTACTCTT CAAGTTAAAG ATAGCGATGA CAGAGATTTT 
GAATTAAAGG CCAAGTTTAC TCTAAAAAGT TCTATTTTAA TAAACAGTTA TGGCACGAAT 
ACTGAAGAGA CAGGAAATAA AGAACAAGAA GATGTAGATA AGATTCATAT AAAGTACAAT 
GGTGAGCCTG TATTGCCTGG TACGTCTTTA AAGGGTGCCA TTAAAGCAAG ATGTGTGAAA 
ATTATAAATA CCTTAATTGA TAATAAAAAT TACATTTTGC CTGACAAAAT TGAAAGTCTT 
CTTAACGACC TTTTTGGATT TGTGGATAAT GAAGGCAAAA CAAAACGAAA GCAAAAAAGC 
AGATTGATTG TTGAAGAAAG TATCATAGAG GGAGCAGAGG AAAGTGAACA AACAAGAATA 
AAAATTGACA GGTTTACAGG AGGAGTTATT GAAGGGGCGT TAGTTAAATC AAAACCTGTA 
TGGCACAAAA ATGAAGAAGT AGAAATGTGC ATAAAAATTG AAAAAGCCAA AGAATGGGAG 
ATTGGATTAA TTTTACTTGT ACTTAAGGAT TTATGGTCTG AAGATTTACC AATAGGTGGT 
GAAAAAAGTA TAGGAAGGGG GCTTTTGAGC GGCAAATTAG CTCAAATTAA GTATGGAAAT 
AAAGAATATA TAATAAAACA GAATGGCAGA AAATTAGAAA TCCAAGGCAA CAAAGCTGAG 
CTTGAAAATT TTGTAGAACA ACTTTTAAAG GAAATGGGGG TGTAA

Protein sequence

MCKIKGRLIL KGILKNESPF VIGKGKGDLI DIEILKGEKG MPYIPATSFI GVLKHHICNE 
KFDIEDEYTW NYFWGDNVKE NDNDSNTGIQ SHFMVSDIKL EEEQTGILAI RDGIAIDSRY 
GVAKEKAKYD YEVVNKNLTW GFCAELILRE GVNENLFFKI LNTVLNELKQ GRVRIGAFTT 
KGFGKFRLVD CNVYLFVFPK DGEKYLKFLA DEENALKELE EFDLSEYGTL QVKDSDDRDF 
ELKAKFTLKS SILINSYGTN TEETGNKEQE DVDKIHIKYN GEPVLPGTSL KGAIKARCVK 
IINTLIDNKN YILPDKIESL LNDLFGFVDN EGKTKRKQKS RLIVEESIIE GAEESEQTRI 
KIDRFTGGVI EGALVKSKPV WHKNEEVEMC IKIEKAKEWE IGLILLVLKD LWSEDLPIGG 
EKSIGRGLLS GKLAQIKYGN KEYIIKQNGR KLEIQGNKAE LENFVEQLLK EMGV