Gene TM1040_1565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1565
Symbol
ID	4078374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1671523
End bp	1673154
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	60%
IMG OID	638006878
Product	AMP-dependent synthetase and ligase
Protein accession	YP_613560
Protein GI	99081406
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGTGGT TGGCCGATGA AACCGGGTTG GAGCGCAGGG CTGCAAATTA TGTCGCGCTG 
ACGCCGCTGT CCCATTTGCA GCGGGCGGCG CATGTCTTTG CCGACGAACC CGCCTTGGTC 
TACGGTCAGA CTCGGCGCAG CTATGCCCAG TATCATGATC GCTGCACGCG GTTGGCGTCG 
GCATTGGCCG GGATGGGGGT TGCTCCGGGC GATGTGGTGG CAACATTGCT GCCCAACATC 
CCCGCACAGG CGGAGGCACA TTTTGGCGTG CCAGCCTGCG GGGCGGTGCT CAATACGATC 
AACATTCGGC TGGATGTGGA TACGGTGGCC TATATCTTTG ATCACGGTCA GGCCAAAGTC 
GTGCTTGTGG ACAGTGAATT CTTGCCTCTT GCCGAAGCCG CCAAAGAAAG ACTGCAGGGC 
GCAGGCCCTA CCCTCATTGA AGTGCCGGAC ACAGAGGCTG GCCATGCGGC CAGCGGTCGC 
TACACCACCT ATGAAGACCT GATCGCGCAT GGTGCAACTG ATTTTGACTG GATCATGCCC 
GAGGATGAAT GGGAGAGCCT CGCGCTCAAT TACACCTCTG GCACCACCGG GCGCCCGAAA 
GGCGTGGTCT ACCATCACCG CGGCGCCTAC CTGATGACCA TGGGCACGGT GGTGTCGTGG 
CGGTTGCAAC TGCGCCCGGT CTACCTGACC ATCGTGCCGC TGTTTCATTG CAACGGCTGG 
AACCACACTT GGATGATGCC GGTCCTGGGC GGCACCGTGG TTTGCTGTCG CAACACCACC 
GCCGAAGCCA TCTATAACGC CATCGCGGAT GAGGGTGTCA CCCATTTTGG CGGCGCGCCC 
ATCGTGCTCA ACATGATCGT GAACGCCAAG GACACCGAGC GCCGCGCCTT TGACCACACG 
GTCGAAGTCT TTACCGCCGG TGCGCCCCCT GCCCCGGCCA CGCTCGAGAA AATCGAACGC 
CTGGGCTTTC ATGTCACGCA AGTCTACGGG CTTACAGAGA CCTATGGTCA TGTGACGGAA 
TGCCTCTGGA AAGGCGACAG CTGGGACGAG CTGGATCAAC AAGGGCGCGC CGCAATCAAG 
GCACGTCAGG GCGTGGCCTT TCCAATGATG GACCACATCA CGGTCATGGA CGCCGACATG 
CAACAGGTCC CCATGAATGG CAGCGATCAG GGGGAAATCG TGATGCGGGG CAACTCCGTC 
ATGAAAGGTT ACCTAAAGAA CCCGGAAGCC ACTGAAGAGG CGTTTGCGGG CGGCTATTTC 
CACTCTGGCG ACATCGCGAT TCAGCACCCG GATGGCTACA TCCAGATCGC GGACCGCGCC 
AAGGACATCA TTATCTCGGG CGGGGAGAAC ATCTCTTCCG TTGAAGTCGA GGGGGTCCTG 
ATGGGCCATC CGGATGTGAA CCTTGCGGCG GTCGTGGCAA AACCGGACGA GAAATGGGGC 
GAAGTGCCCT GCGCCTTTGT GGAACTCAAA GAAGGCGCAG ATGTCGATGA GGCATCCCTA 
ATTGCCTTTG CCCGCCAAAC GCTTGCGGGC TTTAAGACAC CCAAGGCAGT GGTCTTCTGC 
GAGCTCCCCA AGACCTCGAC CGGAAAGATC CAGAAGTTTG AACTGAGGAA GAGCTTCGCA 
GGGGGGAGTT GA

Protein sequence

MGWLADETGL ERRAANYVAL TPLSHLQRAA HVFADEPALV YGQTRRSYAQ YHDRCTRLAS 
ALAGMGVAPG DVVATLLPNI PAQAEAHFGV PACGAVLNTI NIRLDVDTVA YIFDHGQAKV 
VLVDSEFLPL AEAAKERLQG AGPTLIEVPD TEAGHAASGR YTTYEDLIAH GATDFDWIMP 
EDEWESLALN YTSGTTGRPK GVVYHHRGAY LMTMGTVVSW RLQLRPVYLT IVPLFHCNGW 
NHTWMMPVLG GTVVCCRNTT AEAIYNAIAD EGVTHFGGAP IVLNMIVNAK DTERRAFDHT 
VEVFTAGAPP APATLEKIER LGFHVTQVYG LTETYGHVTE CLWKGDSWDE LDQQGRAAIK 
ARQGVAFPMM DHITVMDADM QQVPMNGSDQ GEIVMRGNSV MKGYLKNPEA TEEAFAGGYF 
HSGDIAIQHP DGYIQIADRA KDIIISGGEN ISSVEVEGVL MGHPDVNLAA VVAKPDEKWG 
EVPCAFVELK EGADVDEASL IAFARQTLAG FKTPKAVVFC ELPKTSTGKI QKFELRKSFA 
GGS