Gene TM1040_3669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3669
Symbol
ID	4075638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	721903
End bp	723342
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	60%
IMG OID	638005189
Product	DNA polymerase III, epsilon subunit
Protein accession	YP_611898
Protein GI	99078640
COG category	[L] Replication, recombination and repair
COG ID	[COG2176] DNA polymerase III, alpha subunit (gram-positive type)
TIGRFAM ID	[TIGR00573] exonuclease, DNA polymerase III, epsilon subunit family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.731231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAGAT CCCTGTCCCT TCGCCTGCGC ATCTTCCTGT TCTTCTGCCT CCTGGCTGTG 
GGAGCAATCG CGCTGGCTGC GGTGGCGTTG GGTTTTGTCT GGACCCGCTC TGATTCAGAG 
TGGACGGCTT CAGAACTCAC CACGGTGATC CTGTTGTTCG GGTTTTTGAA TACAGGTCTG 
GTGCTGGGGA TCTGGCTGCT GTTTGACGAA AACGTCGCGC GCCCGATCGA GGGGCTTTCG 
ACCAGTCTGC GCCTGCGTGC CCACTCCGGA ATTGAGGACA GCATCAAAGC ACAGGCAGCG 
CAATACCTCG GCGATCTGGC CCCGGCGGCA CGCGCGCTGT CGGATGCGCT TGCGGCTTCT 
GGAGATCAGC CACCAGAACA GACCCAGCGC CTGCTTCAGG AACGGGAGCG GCTGACTGCG 
TTGCTCAGCG AAATTCCCAT TGCGACGATC CTTGTAAACG CAGCAGGTGA GATTGCACTC 
TATGACGCGC AGGCCGGGGC CATCCTCTCC CGCATCGCCG CACCGCGCCT TGGGGCGCCA 
CTCTCGAACT ATTTCGATCT GACGCCCGCA ATCGGCGCCT GTGCCCGAGC AGACCGGCGC 
CTCGTAGCGG GGCATGTGAC CGTCCCAGAC TGCAATCATG CCGAAACGTT CAATCTGCAG 
ATAAAATCGC TCGGTGCGGA GGGCGATGTG ATCTTCCTTG AAGCCGATAC GCGGGCGGAG 
CGCGACACGC TGTCCCCTCC TTTGGTCTTT GATTTTGACC TTCTGGATCA GAAACTTGAG 
GGGACGATAA CGGCCAGACG CCTCTCGGAG CTGAACTTCG TGGTCTTTGA CACCGAGACG 
ACCGGGTTGT CGGTTACCAA GGATGCCATC GTGGAACTCG CCGCTGCCCG TGTGCTGAAC 
GGGCGCATCC TCGACGGCGA GGTCTTTGAA ACCTATGTCG ATCCAGGCCG ACCGATCCCC 
GCAGCGTCCA CCAAGATACA TGGCGTACGC GATGCGGATG TGGCGCAGTC ACCCCGGATC 
GAAGCGGTGA TCCCGGCGTT TCATGACTTT GCACAGAGCG CCGTTCTGGT TGCCCATAAC 
GCCCCCTTTG ACATCGGGCT ATTGCGTCAA CAAGAGGTTC AGACCGGGTG CAGTTGGGAC 
CATCCGGTTG TCGATACAGT GCTGTTGTCG GCCTTAGTGT TTGGGATTTC AGCGGATCAT 
TCGCTGGATG CTTTGTGCAG CCGTCTTTCG ATCGAAATCC CCGCCCGGCA CCGCCATACG 
GCCAAGGGAG ATGCGCGCGC TACGGCAGAA GCGCTCATAC GCCTTCTGCC GCTCTTGCAG 
GGCAAGGGGA TCGAGACCTT TGGTCAACTC CTAAAGGAAA CCTCCAAATT TGGCCGACTG 
CTGCGGGACA TCAACTCTGA CCACGTCCGA AACGCGCCCG AGATGAGCGA CAGCCCCTAG

Protein sequence

MLRSLSLRLR IFLFFCLLAV GAIALAAVAL GFVWTRSDSE WTASELTTVI LLFGFLNTGL 
VLGIWLLFDE NVARPIEGLS TSLRLRAHSG IEDSIKAQAA QYLGDLAPAA RALSDALAAS 
GDQPPEQTQR LLQERERLTA LLSEIPIATI LVNAAGEIAL YDAQAGAILS RIAAPRLGAP 
LSNYFDLTPA IGACARADRR LVAGHVTVPD CNHAETFNLQ IKSLGAEGDV IFLEADTRAE 
RDTLSPPLVF DFDLLDQKLE GTITARRLSE LNFVVFDTET TGLSVTKDAI VELAAARVLN 
GRILDGEVFE TYVDPGRPIP AASTKIHGVR DADVAQSPRI EAVIPAFHDF AQSAVLVAHN 
APFDIGLLRQ QEVQTGCSWD HPVVDTVLLS ALVFGISADH SLDALCSRLS IEIPARHRHT 
AKGDARATAE ALIRLLPLLQ GKGIETFGQL LKETSKFGRL LRDINSDHVR NAPEMSDSP