Gene TM1040_1324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1324
Symbol
ID	4078367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1409890
End bp	1412040
Gene Length	2151 bp
Protein Length	716 aa
Translation table	11
GC content	48%
IMG OID	638006632
Product	hypothetical protein
Protein accession	YP_613319
Protein GI	99081165
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.772779
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCC CTCGCTGGAG GTGGAAGAGT ATCTATACTA CAAACTATGA CACTCTCGTA 
GAACAATCGT TCGATAGTGC CAAAAAGAGG TGTCGAGTAT ATTCTTCTAA CTTTGACTTC 
CATATAGATG AGGAAGAATA CGATTGCGAG CTATTTAAGA TTCATGGGAC AATTGAAAAA 
GATATTTCAA CCGGCCATCA TAGCAGAATT ATCCTGACTG TGGATGACTA CGATCATACT 
GAAGAGTTTC GAGAACAGCT TTATGATCGG ATGCGCGGCG ATCTGGCAGG TGCCGATCTT 
GTGATAATTG GGCAATCACT GTCCGATCCA GACATGGATA CTCTGGTGAG GCGGGCTGTA 
AAGATCAATG AAAAAGCGCT ATCCCCTGGT CAGATCACAC TTCTGATCTA CTCTGAAAAC 
CAAAGTCGTG CGCTCCTTCA AGAACGCAAA GGGTTGCGTG TAGTCTTCGG CGGAATTGAC 
GAGTTCTTCA CGCGACTCGA CAAAAGACCG CCAAAGATCG CACCCGTCAT GATTTCGAAA 
GACGACGAGG CGCTAATCGG CACGCATATA TCAAACTCTA TTGTCGAAGT GTCGGAAGTT 
TCCAATGGAG CCGAAGCCGA CGTCAGTTCG ATGTTCAACG GCTGGCCTGC AACTCACCGA 
GAGGTCGAAG CGGGCCTAAC ATTCGAACGC GATATCTCAC GTGAGGTTGC TAAACACTTT 
GAAGATCCTT GTACCCTTTC TGGGGTTATT CTAGGGGCTG CCGGAGTAGG CAAGTCAACC 
GCTGCCAGAC AGACATTACA ACTCCTCCGC CGCGCAGGCT TCAGGGCCTG GGAGCATGTG 
AATGAACATA CTCTTAGCGT CGCCAACTGG AGAAAGATTG CCGGAAACCT CAAGGAAAGT 
GAGCTCTTAG GTGTCCTGCT TGTAGACGAA GCACATTCTC ATTTGCACCA ACTTAATGAG 
CTGATGGACC TGCTTGTCGC AGATGACAAT CCGCACCTGA AAATTCTTGC TGTTTCAACA 
AAAAGCAATT GGATACCTCG AAGCAAAACA CCAAACTTCA ATCGTTGTGG GAAGGATTTT 
TGGCTTTCAA AACTGTCTGT AGATGAGATC GACCGGCTCT TGAATTTAAT TGAACGACAG 
CCGCGCATCC GTGAGCTTGT CGAGGAGTCT TTTAGCGGAT TCAACAAAGG CGAGCGCAGA 
AGGCGGTTGG TGCATAGATG CGAAGCAGAC ATGTTTGTTT GTCTGAAGAA CATTTTTGCG 
TCTGAGTCGT TCGACGATAT CATCCTTCGA GAATTTGCTG GCTTGGACGC CATCCCTCAG 
GACATTTATA AACACGTCGC AGCTATGGAG ACACTCGGAG TACGCGTCCA CCGCCAACTT 
GCCGTTCGCA TGCTTAACGT TGAAGCGAGC AATATCTCAA ATATTTTGAC TTCCTTGGAT 
GATATCGTCG AAGAATATCC GGTTGATCGA CGCAAAGGAA TATATGGGTG GAAGTGCAGG 
CATGGTGTCA TTTCAGAAAT TGTCACTAGA TACAAATTTG GGGATCTCGA ACAGATAATA 
TCCCTCCTTG ATCACGTCAT AGATAACATT TCTCCGTCCT ACGATATTGA GGTTAGAACC 
CTGCGCGAGC TTTGCAATCT CGACGGCGGA ATTTCACGAA TTCCCGAAAA GAAAGAGCAG 
AATCGTCTAT TGAGGCGAAT GATATCCATG GCCCCAGGCG AGAGGGTTCC GCGACATCGG 
CTGATCAGGA ACCTCATCGA CCAAGGTGAG TTTGAGAAAG CGGAAACGGA GATTCGCGTC 
TTCAACTTTG ACTTCGGCTC AGACGGCCCC GTCCATCGCT ATAAAATTAA GTTGATGGTT 
GCTCGAGCAG CTCGTGCGCC TGGTTTGCTC GATGAGGATA GAATTGTTAT TCTTGAGCAA 
GCCCAAGAAC TTGCTTCGAC GGGTATCGCC AGGTTTCCGA ACAATAAGAG TATTCTGTCC 
GCATATGCAG AGCTAGGTTT GGAGTATCTT CGTCGAACCG GGTCATACAG CTTTTTCGAT 
GCCTCTATGG ATGAGTTGAA GGCTGCGGAA GGCCGACTCG GCGACCCAGA TATTACGGCT 
ATGATCAGTC GCTTCGAACG TCGCGCAGCA GGCTCTGAGG CCGAACTCTG A

Protein sequence

MKIPRWRWKS IYTTNYDTLV EQSFDSAKKR CRVYSSNFDF HIDEEEYDCE LFKIHGTIEK 
DISTGHHSRI ILTVDDYDHT EEFREQLYDR MRGDLAGADL VIIGQSLSDP DMDTLVRRAV 
KINEKALSPG QITLLIYSEN QSRALLQERK GLRVVFGGID EFFTRLDKRP PKIAPVMISK 
DDEALIGTHI SNSIVEVSEV SNGAEADVSS MFNGWPATHR EVEAGLTFER DISREVAKHF 
EDPCTLSGVI LGAAGVGKST AARQTLQLLR RAGFRAWEHV NEHTLSVANW RKIAGNLKES 
ELLGVLLVDE AHSHLHQLNE LMDLLVADDN PHLKILAVST KSNWIPRSKT PNFNRCGKDF 
WLSKLSVDEI DRLLNLIERQ PRIRELVEES FSGFNKGERR RRLVHRCEAD MFVCLKNIFA 
SESFDDIILR EFAGLDAIPQ DIYKHVAAME TLGVRVHRQL AVRMLNVEAS NISNILTSLD 
DIVEEYPVDR RKGIYGWKCR HGVISEIVTR YKFGDLEQII SLLDHVIDNI SPSYDIEVRT 
LRELCNLDGG ISRIPEKKEQ NRLLRRMISM APGERVPRHR LIRNLIDQGE FEKAETEIRV 
FNFDFGSDGP VHRYKIKLMV ARAARAPGLL DEDRIVILEQ AQELASTGIA RFPNNKSILS 
AYAELGLEYL RRTGSYSFFD ASMDELKAAE GRLGDPDITA MISRFERRAA GSEAEL