Gene RPD_4105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4105
Symbol	xseA
ID	4024627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4569989
End bp	4571599
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	70%
IMG OID	637964313
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_571225
Protein GI	91978566
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGAC TGCTCGCCCC CGAAACCCTC GCCAATGTCG GCGAATTCAC CGTCTCCGAA 
CTGTCGCAGG CGCTGAAGCG GACGGTCGAG GACAGCTATG GCCATGTCCG GGTGCGCGGC 
GAAATCTCCG GGTTCCGCGG CGCGCATTCG TCCGGGCATT GCTATTTCGC GCTGAAGGAC 
GAGAGCGCCA AGATCGAGGC GGTGATCTGG AAGGGCGTGG CGGGGCGGAT GCGGTTCAAG 
CCGCAGGAAG GCCTCGAGGT CATCGCCACC GGCAAGCTCA CCACCTATCC GGGCTCGTCG 
AAATATCAGA TCGTGATCGA GGCGCTGGAG CCCGCCGGCG TCGGAGCGCT GATGGCGCTG 
ATGGAAGAGC GCAAGAAGAA GCTCGGCGCC GAGGGCCTGT TCGACGAAGC GCGCAAGCAG 
CTTTTGCCCT GGCTGCCGGA CGTGATCGGC GTGGTCACCT CGCCGACCGG CGCGGTGATC 
CGCGACATTC TCCACCGGCT GGAAGACCGC TTCCCGCGCC GGGTCCTGGT GTGGCCGGTG 
AAGGTCCAGG GCGAAGGCTC GGCCGAACAG GTCGCGGCCG CGATCCACGG CTTCAACGCG 
CTGCCCGAGG GCGGCCCGAT CCCTCGGCCC GATCTGTTGA TCGTCGCGCG CGGCGGCGGC 
TCGCTCGAGG ATCTGTGGTC GTTCAACGAG GAAATCGTGG TGCGCGCCGC GGCGGAAAGC 
ATGATCCCGC TGATCTCCGC GGTCGGTCAC GAGACCGACG TGACGCTGAT CGATTTCGCC 
GCCGACAAGC GCGCGCCGAC GCCGACCGCC GCCGCCGAAA TGGCGGTGCC GGTGCGTGCC 
GAACTGTTCG TCGAGGTGCA GAGCTTTTCG CGGCGGATGA TGCTGTGCTG GACGCGCGGT 
CAGGATTCCC GCCGCAACGA ACTCCGCGCC GCCGCCCGCG CTCTGCCGGC CGCAAGCGAA 
CTGCTCGCGA TCCCGCGGCA ACGGCTCGAC ACGGCGGCGG CGGGGCTGCC GCGGGCGCTG 
CGCGCCAATA CGCATGCGCA TCATCGCCGC TTCGCCAAGG CCGCGGCGGG CATCACCCTC 
AACGTTCTGC GGGCGCAGGT CAGCCACAGC GCGCAGCGGC TCGGCATCAC CGGCGAACGG 
CTGAAGCATG GCGCCCGCGC CACGCTGCGC CATCGCCGCG ACCGCTTCGA CGGTCTCGCG 
ATCCGGCTGC AGGCCTCGAA ACTCGCCAAT GAGCAGGCGC AGCGGATGCA GATCGCGCGC 
GAGCGCGAGC GGATGCAGCG GCTCGCCGAG CGCGCGCGGC GTGCGCTGAC GACGCTGCTC 
GATCGTCAGC AGGCGCGCCT GACGCAATCC GGCAAATTGC TGACCGCCCT GTCCTATCGC 
GGCGTGCTGG CGCGCGGCTT CGCACTGGTG CGCGACGCCG ACGGCCACGC CGTCCATGCC 
GCCGCAGCGG TGAGCGCCGG CGCGCAACTC AGCGTCGAAT TCGCCGACGG CCGCGTCAGC 
GTCACGGCGG ATGGCGGCCA TGCCGGCGAA CCAGCAAAGC CGACGACGCC AGCGTCCAAA 
CCAACGCAGA AGCGCACACC GAAGCCGGTC GATCAGGGGT CGCTGTTCTA G

Protein sequence

MARLLAPETL ANVGEFTVSE LSQALKRTVE DSYGHVRVRG EISGFRGAHS SGHCYFALKD 
ESAKIEAVIW KGVAGRMRFK PQEGLEVIAT GKLTTYPGSS KYQIVIEALE PAGVGALMAL 
MEERKKKLGA EGLFDEARKQ LLPWLPDVIG VVTSPTGAVI RDILHRLEDR FPRRVLVWPV 
KVQGEGSAEQ VAAAIHGFNA LPEGGPIPRP DLLIVARGGG SLEDLWSFNE EIVVRAAAES 
MIPLISAVGH ETDVTLIDFA ADKRAPTPTA AAEMAVPVRA ELFVEVQSFS RRMMLCWTRG 
QDSRRNELRA AARALPAASE LLAIPRQRLD TAAAGLPRAL RANTHAHHRR FAKAAAGITL 
NVLRAQVSHS AQRLGITGER LKHGARATLR HRRDRFDGLA IRLQASKLAN EQAQRMQIAR 
ERERMQRLAE RARRALTTLL DRQQARLTQS GKLLTALSYR GVLARGFALV RDADGHAVHA 
AAAVSAGAQL SVEFADGRVS VTADGGHAGE PAKPTTPASK PTQKRTPKPV DQGSLF