Gene TM1040_1945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1945
Symbol	xseA
ID	4076896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2048352
End bp	2049860
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	65%
IMG OID	638007261
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_613940
Protein GI	99081786
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0916178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACC TCCTTGATGA TCCAACCCCG GGCCAGAACG CACCGGAGTT TTCCGTCTCC 
GAGATTTCCG GCGAGGTCAA ACGCACGCTT GAGGGCACCT TTGGCCGCAT CCGCGTGCGG 
GGCGAGGTCG GGCGTGTGTT CAAGGCGCGC TCCGGTCATC TTTATTACGA CATCAAGGAT 
GATCGCTCGG TGCTGGCCTG CACGACCTGG AAGGGCCAGA TTTCGGGACT GTCCGTGGTG 
CCCGAAGAAG GGCTTGAGGT GGTGGTGACC GGGCGCCTCA CGGCCTTTGG CGGACAATCC 
AAATACAATA TGAATGTCGA TGAGGTCGCG GTTGCAGGCC AGGGCGCGCT GATGGCGCTC 
TTGGAAAAGC GCAAGGCGCA ACTGGCCGCT GAAGGGCTGT TTGCACCCGA GCGCAAGAAA 
CCGCTGCCCT ATCTGCCGGG GATCATCGGC GTCATCACGT CGCCTTCAGG CGCTGTGATC 
CGTGACATCC TGCATCGGCT TCGGGATCGC TTCCCGCGCA AGGTGCTGGT CTGGCCCGTG 
GCCGTGCAGG GCAGCAACTC GGCCCCCGAG GTGGCGCGCG CCATCGATGG GTTCAACGCT 
CTGACGCCCG GCGGCGCCTT GCCCCGGCCG GACCTGATCA TTGTCGCGCG CGGCGGCGGG 
TCCATCGAGG ACCTCTGGGG TTTTAACGAG GAGATCGTCG CCCGCGCCAC CGCCGCAAGT 
GACATCCCGC TGATTTCGGC GGTGGGCCAT GAGACGGATA CCACGCTGAT CGACTACGTT 
TCGGATCTGC GTGCCCCCAC GCCCACGGCG GCGGCAGAAC ACGCGGTGCC CGTGCGGCTC 
GAGTTGTTGG GCTGGGTCGA AAATCAGGGC GCGCGCATGG CCAATGCCGC CAGCCGCGCG 
GTGCAGCTGC GCCGCCAGCG GCTCGGAGAT ATGGCGCGCG CTCTGCCGCG CCCGGATACG 
CTCTTGGAAA CCCCGCGCCA GCGGCTCGAC AGAGTCTCTG ACCGGCTGCC CAATGCGCTG 
ATTTCGGGCG TGCAACGGCG CAAACTCACG CTCAGCGACC GCGCCGCCTC CCTCAGACCC 
GCCACCCTGC GCGGTCTTGT TTCCAGCCGT CAGGACAAGC TCAAAAACCT TTCTTCGCGT 
CTCACCCTAC GCCCGATCAC TCAGGATCTG GGGCGCAAAC GAGACGCGCT GGACCGCATC 
ACCAAGCGCC TTAACACTGC CCAAAGCAGC CGCATCGACC GCCAGATTGA TCGTCTGTCA 
GCCACGGCGC GACAGCTTGA TATTCTGAGC TACAAGGCCA CGTTGCGTCG CGGGTATGCT 
GTGGTGCGCG ATGGCGCGGC CCTGGTCACA TCCACCGAAG GCGCCCGGAA GGCCGCTGAA 
CTCTCTATCG AATTTGCTGA CGGCACGTTT GATGTCGCCA GCGCCCCCAG CACCACAAAG 
AAATCCGCGC CCAAACCGGC GGCCCCGAAG GCGCCCAAAA CGCCCGGAGA GCAGGGCTCT 
CTATTCTGA

Protein sequence

MSDLLDDPTP GQNAPEFSVS EISGEVKRTL EGTFGRIRVR GEVGRVFKAR SGHLYYDIKD 
DRSVLACTTW KGQISGLSVV PEEGLEVVVT GRLTAFGGQS KYNMNVDEVA VAGQGALMAL 
LEKRKAQLAA EGLFAPERKK PLPYLPGIIG VITSPSGAVI RDILHRLRDR FPRKVLVWPV 
AVQGSNSAPE VARAIDGFNA LTPGGALPRP DLIIVARGGG SIEDLWGFNE EIVARATAAS 
DIPLISAVGH ETDTTLIDYV SDLRAPTPTA AAEHAVPVRL ELLGWVENQG ARMANAASRA 
VQLRRQRLGD MARALPRPDT LLETPRQRLD RVSDRLPNAL ISGVQRRKLT LSDRAASLRP 
ATLRGLVSSR QDKLKNLSSR LTLRPITQDL GRKRDALDRI TKRLNTAQSS RIDRQIDRLS 
ATARQLDILS YKATLRRGYA VVRDGAALVT STEGARKAAE LSIEFADGTF DVASAPSTTK 
KSAPKPAAPK APKTPGEQGS LF