Gene Clim_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2037
Symbol	xseA
ID	6355541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2248219
End bp	2249616
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	55%
IMG OID	642669632
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_001944045
Protein GI	189347516
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGATG TTGCGGTTAT GCGCGAATGG CTCACTGGCA CTAATATAAA GGAATATATC 
CAATCCCGTA AATCACACCC CGACAGGATG CTCCGGCATC AGGCCAGGCA GAAGAACTCC 
GGATTATGCA CGGTTTTTTA TTATTCTGTT GAAAGGAATC TTTTTTTCAA CTCTTCTCAT 
CTTATTGCGA TGGGCGATGT CACGCTCTCT GTCAGTGAAC TGACCTTCCG GATTAAATCC 
GAGCTTGAAA GCATCTTCCC CGTGGTGCGC GTCAAGGGCG AAATTTCGAA TTGCAAACGA 
CACAGCTCGG GTCACACCTA CCTGACCCTG AAGGATGACC AGGCACAGAT ACCTGCGGTA 
ATCTGGAAAA ACACCGGAAC CCGGATCAGC TTCGATCTCC GTGACGGCAT GGAGGTGATC 
GCTGAAGGAC GACTGGAGGT GTACCCGCCT TCAGGGCGCT ATCAGCTTAT CTGCTCCTCG 
GTAACCGAAG CCGGTCAGGG GCAGCTGCAG CAGGCGTTCG CCATGCTGCT CCAGAAACTC 
GCAAAGGCCG GCTATTTCAA CGCGGAAAGA AAGAAAAAAA TACCGGCAAT ACCCGAAACC 
ATCGGCATTA TCACCTCGCC GACCGGAGCC GTGATCGAGG ACATGGGCAG GGTGATCGAA 
CGGCGTTTTC CTGCCGTTCG GATTCTGCTC TTTCCCGTCA GGGTACAGGG CGACGATGCG 
GCGCGCGAGG TGAAAAGAGG CATCGACTAC TTCAACAATC CGGCCGATCC GCGACACCGC 
GCGGATGTGC TGATCGTTGC CCGTGGCGGC GGATCCATGG AAGATCTCCA GGCATTCAAC 
GAAGAGATGG TGGCCGAAGC CATCTACCGC TCATCGGTTC CGGTCATCAG TGCCGTCGGC 
CATGAAACCG ATATCACCAT AGCTGACATG GTGGCCGATC TCCGTGCGGG AACTCCGTCG 
ATTGCAGCGG AACTTGCCGT ACCCGACAGG GGAGATCTGC TGAAAACCAT TGAAAACCAG 
CAGATGCGCC AGAGCGCCCT GATGCAGGCA AAGCTCGATG GCGCGAAAAT GGAGATCGAC 
TCCCTTCGGC AGAGCTACGC ATTCAACCGG CCGCTGATGC AGCTGCAGCA GTTGTCGGAA 
AAAGCCGAAA GCTTTCCGGA ACTGCTTGAC CTGGCCGTCA GGAGGAAATG GCTGCAGAAG 
GCGACGGAGT TTGCCGCTGC CAACCAGCAG CTTGCCCTGC TCGATTACCG GAAAATTCTT 
CAACGGGGCT ACGCTCTGGT AAAAAAAGAG ACCCGATTCA TAACCGGTTC ATGCGAACTC 
GGGCTCTCCG ACCGTGCGGA CATTCTCTTT CATGACGGAA GTGTTGCCGT AACGGTCACC 
GGCCCGCCGA CCTCCTGA

Protein sequence

MNDVAVMREW LTGTNIKEYI QSRKSHPDRM LRHQARQKNS GLCTVFYYSV ERNLFFNSSH 
LIAMGDVTLS VSELTFRIKS ELESIFPVVR VKGEISNCKR HSSGHTYLTL KDDQAQIPAV 
IWKNTGTRIS FDLRDGMEVI AEGRLEVYPP SGRYQLICSS VTEAGQGQLQ QAFAMLLQKL 
AKAGYFNAER KKKIPAIPET IGIITSPTGA VIEDMGRVIE RRFPAVRILL FPVRVQGDDA 
AREVKRGIDY FNNPADPRHR ADVLIVARGG GSMEDLQAFN EEMVAEAIYR SSVPVISAVG 
HETDITIADM VADLRAGTPS IAAELAVPDR GDLLKTIENQ QMRQSALMQA KLDGAKMEID 
SLRQSYAFNR PLMQLQQLSE KAESFPELLD LAVRRKWLQK ATEFAAANQQ LALLDYRKIL 
QRGYALVKKE TRFITGSCEL GLSDRADILF HDGSVAVTVT GPPTS