Gene Athe_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2065
Symbol
ID	7408774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2182081
End bp	2183421
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	37%
IMG OID	643716432
Product	DNA repair protein RadA
Protein accession	YP_002573915
Protein GI	222530033
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1066] Predicted ATP-dependent serine protease
TIGRFAM ID	[TIGR00416] DNA repair protein RadA

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0567358
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACAA AAAGCATTTA TGTTTGCCAG GAGTGCGGCT TTAGAACCTC AAAATGGCTT 
GGAAGATGTC CAAACTGTTC AAGCTGGGAT ACCTTTGTGC TTGAAAGAAT GGACCAAAAC 
AAAAAAGAAA CTATCTCTAT TACAAAAGAG AATTCAGCAG TATTAAAACT TTCTAATGTC 
AGCACAAAAG AAGAAAGATT TTTATCTGGC ATAGAAGAGC TGGACAATGT CCTTGGTGGC 
GGATTTGTAA AGGGAGAGCT CATTTTGCTT GGTGGTGAGC CGGGGATTGG AAAGTCAACT 
TTGCTTTTGC AGGTTGCAAA TATATTAAGC GAAAGAATGA AGGTTTTATA TGTATCAGGC 
GAGGAAGGAG CAAATCAGCT AAAACTTAGG GCTCAAAGGC TCAATATAGA TGGGAATTTT 
GATGTTGTGT GTGAAACCAA TTTTGATTTG ATAAAAAATA TTATCTTGGA AACAAAACCA 
GAGTTTGTTA TAATTGATTC TATACAAACC ATGTATATAC CAGAAAACCA GTCAGCACCT 
GGAAGTGTAA CCCAGGTCAG AGATGTGACA ATGCAGCTTT TGAAAATTGC AAAGACGTAT 
AAAATAACAG CTGTAATTGT GGGGCATGTC ACAAAAGATG GTCTTATTGC AGGACCAAGG 
GTTTTGGAAC ACATGGTTGA CTGTGTTTTG TATTTTGAAG GAGAGAGGTT TAACACTTAT 
AGAGTAATCA GAGCTTACAA AAATAGATTT GGTCCTACAA ACCAGCTTGG AATTTTTGAG 
ATGACAGACG GTGGACTTGT TGAGGTAAAA AATCCTTCAA GCATTTTTTT GGAAAGCTCC 
TACAATGTTG AGGGTGTTGC TATTTACTCA GCAATAGAAG GAACAAGGTC TATTCTTTTA 
GAGATACAGG CACTTGTAAC TCCAACATCT TTTGGCACGC CAAGAAGGAC AGTGACTGGA 
ATTGATTATA ACAGATGCGT GATGCTCTGT GCTGTGCTTG AAAAGAAGAT GGGATTTGCG 
TTAAATGTTC AGGATATATA TGTAAATGTA GCAGGTGGAT TTAAGGTTTC AGAGCCCTCA 
GCAGACCTTG CTATTGTATG TGCCATAGCT TCAAGTTATA AAGGGGTTCC CATTGGAGAT 
ACTGTATTAA TAGGTGAAGT GGGTTTGACA GGCGAGATTA GAGCTGTGTC TAATATAGAA 
AAAAGATTGA ATGAAGCAAA AAAGCTGGGA TTTAAAAGAG CAATAATTCC AAAAAGAAAT 
ATGGAAGCGA TCCAAAATGA TGGTATGATT GAAGTCTTTG GTATGTCAAA TATAGAGGAA 
GTCTTGAATT TTATATTTTA G

Protein sequence

MKTKSIYVCQ ECGFRTSKWL GRCPNCSSWD TFVLERMDQN KKETISITKE NSAVLKLSNV 
STKEERFLSG IEELDNVLGG GFVKGELILL GGEPGIGKST LLLQVANILS ERMKVLYVSG 
EEGANQLKLR AQRLNIDGNF DVVCETNFDL IKNIILETKP EFVIIDSIQT MYIPENQSAP 
GSVTQVRDVT MQLLKIAKTY KITAVIVGHV TKDGLIAGPR VLEHMVDCVL YFEGERFNTY 
RVIRAYKNRF GPTNQLGIFE MTDGGLVEVK NPSSIFLESS YNVEGVAIYS AIEGTRSILL 
EIQALVTPTS FGTPRRTVTG IDYNRCVMLC AVLEKKMGFA LNVQDIYVNV AGGFKVSEPS 
ADLAIVCAIA SSYKGVPIGD TVLIGEVGLT GEIRAVSNIE KRLNEAKKLG FKRAIIPKRN 
MEAIQNDGMI EVFGMSNIEE VLNFIF