Gene Sare_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4039
Symbol
ID	5705020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4596467
End bp	4597426
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	72%
IMG OID	641273465
Product	DNA polymerase LigD polymerase subunit
Protein accession	YP_001538820
Protein GI	159039567
COG category	[L] Replication, recombination and repair
COG ID	[COG3285] Predicted eukaryotic-type DNA primase
TIGRFAM ID	[TIGR02776] DNA ligase D [TIGR02778] DNA polymerase LigD, polymerase domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.437287
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0570226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGAGG CCGAGGAGAC CCGGAACGGG GTCGCACTGA CGAACCTGAA CCAGCCGTTG 
TTCGACGGGG CGGGCGCGAC CAAGCGTGAC CTGGTCAACT ACCTGGACGC GGTGCGCGAC 
CGTATCCTGC CCCACCTGCG GGACCGGCCA CTGTCGGTGA TGCGGGTGCG GCCCGGCCAA 
CCTCCGTTCA TGCAGAAGAA CCTTCCGAAG TACACCCCGG ACTGGATCCC CCGGACGGGA 
GTGTGGGCGG AGGCGTCGCA CCGCGAGATC TCGTACGCCC TCTGCGGCGA CCGGCGCACC 
CTGCTCTGGC TCGCCAATCA GCGGGCGGTC GAATTTCACC CCACCCTCGC CACGGTCGCG 
GACCTGCGCT GCCCGACTCA CCTCGTGCTC GACCTGGACC CGCCGGAGGG CGCACCGTTC 
GAGTCGGCGG TGGCCGCGGC CCTCCTGGTT CGACAGGCTC TCACCGAGGC TGGGCTTGTC 
GGGGCGGTGA AGACCAGCGG CGCCAAGGGG GTGCACGTGT TCGTGCCGGT GACGGCGGGT 
GCAACGGCGG AGGACCTTGC TGCCGCCACC CGAGCGCTCG CGCTCCGGGC TGCGCGCCTC 
GATCCGGACC TCGCGACGAC CGCCTTCATT CGGGAGGACC GGGGCGGAAA AGTCTTCATC 
GACTCCACCC GGGCTGGTGG GGCAACGGTT GTGGCCGCGT ACAGCCCGCG GCTGCGGCCC 
GGTGTGCCGG TCTCCTTCCC GGTGCCCTGG GCTACCCTGC CGTCGGTCAC ACCCTCCGAC 
TTCACGGTCC GGACCGCGCC CGAACTGGTC GCATCGGGGG ACCCGTGGGC GGACGCGATG 
CCCACGGCCC AGCGACTCCC GGACGACCTG GTCGCCGAAG GCCACACCAT CCCGGTGGCC 
CGGGTGCAGG CGATGCACGA GGGGAAGCGA CGGGCGCGCG CCCGGCGGGC CGCCGGCTGA

Protein sequence

MGEAEETRNG VALTNLNQPL FDGAGATKRD LVNYLDAVRD RILPHLRDRP LSVMRVRPGQ 
PPFMQKNLPK YTPDWIPRTG VWAEASHREI SYALCGDRRT LLWLANQRAV EFHPTLATVA 
DLRCPTHLVL DLDPPEGAPF ESAVAAALLV RQALTEAGLV GAVKTSGAKG VHVFVPVTAG 
ATAEDLAAAT RALALRAARL DPDLATTAFI REDRGGKVFI DSTRAGGATV VAAYSPRLRP 
GVPVSFPVPW ATLPSVTPSD FTVRTAPELV ASGDPWADAM PTAQRLPDDL VAEGHTIPVA 
RVQAMHEGKR RARARRAAG