Gene Clim_0314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0314
Symbol
ID	6353831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	346905
End bp	348083
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	54%
IMG OID	642667943
Product	DNA protecting protein DprA
Protein accession	YP_001942387
Protein GI	189345858
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAGC CACATGCAGG AAAAGATGCC GGGCTTTTCC TGTTGACGCT CGCCAGCGTC 
CCCGGACTCG GGCCTGCAAG AATAAATGCC ATCATAACCC GCTTCGGCTA TCAGCCCGAT 
CTGCTCAGGG CATCTGCGGA TGTATTTCTT GAGGTTCCCG GCATAGGCCG GTCACTTGCG 
GAAGAGATCT CCGGTTTTCT CAGCGGCAGT AAACGACGCG AAGCGGAAGA AGCTTCCCTT 
CGACAGTATG AGGAGCTTGA TCGCCATCAG GCCTCGCTGG TCACGATCTT CGACCCATGT 
TTTCCTGCCC TGCTCAAAGA AATTTATGAC CCGCCCCCTT TTCTGTTCGT TCGCGGCTCT 
TTTTCCGAAC CGGAACCGCC ATCGATAGCC ATAGTAGGAA CCAGGCGAGC ATCAGCTTAT 
GGAAAACAGG CAGCGGGCCT GCTCTCAGGC GAACTTGCTT CCCGGGGCCT GCTGATCGTC 
AGCGGTCTGG CATATGGAAT CGATACCGCG GCGCATGAGG CCGCCATGAG GGCAGGAGGA 
AAAACCATCG CGGTGCTTGC AGGCAGTGTC GACCATGTCT ATACCGATCC CAGGGGGAAA 
ATCTGGCCGA AAATCATCGA ACAGGGTGCT CTCATTTCAG AAGAACTGTT CGGTTCCGAA 
CTGCTCCCCG GAAAATTCCC CAAACGGAAC AGGATCATCT CGGGAATGTC GCTCGGCACT 
GTTGTCGTTG AATCCGACCT GAAAGGTGGA GCGCTCATCA CGGCATCGTA CGCACTTGAA 
CAGAACCGGG AGGTCTTCGC CGTACCGGGA ACCATATACT CGCACAATTC AAGGGGAACA 
AACCGCCTGA TCCAGTCCGG GCAGGCAAAA ATGGTTCTTG CGACAGACGA TGTGCTTGAA 
GAACTTAACC GTCCTTCCCT GAATATCCCG GTGCATGAGC ATGCTGCAAC CGATACCGTA 
ACCATCGTCC TGTCGAAAGC AGAACGTGAG CTGCTGGCGT ACATGGATAC CGGACCGATA 
CATATCGACG CCCTTGCCCT GCAGGCCGGG CATGATATTT CTGAATTGCT CGTTCTGTTA 
TTCGAGCTTG AACTGAAGAA AGCCGTCGTC CAGCTCCCCG GCCAATTCTT TGGTAAAAAA 
CAGATAAAAC ATGAAAAGAA TAGTCATTAT AGGCTCTAA

Protein sequence

MNEPHAGKDA GLFLLTLASV PGLGPARINA IITRFGYQPD LLRASADVFL EVPGIGRSLA 
EEISGFLSGS KRREAEEASL RQYEELDRHQ ASLVTIFDPC FPALLKEIYD PPPFLFVRGS 
FSEPEPPSIA IVGTRRASAY GKQAAGLLSG ELASRGLLIV SGLAYGIDTA AHEAAMRAGG 
KTIAVLAGSV DHVYTDPRGK IWPKIIEQGA LISEELFGSE LLPGKFPKRN RIISGMSLGT 
VVVESDLKGG ALITASYALE QNREVFAVPG TIYSHNSRGT NRLIQSGQAK MVLATDDVLE 
ELNRPSLNIP VHEHAATDTV TIVLSKAERE LLAYMDTGPI HIDALALQAG HDISELLVLL 
FELELKKAVV QLPGQFFGKK QIKHEKNSHY RL