Gene Dgeo_2519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2519
Symbol
ID	4073750
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	+
Start bp	529197
End bp	530885
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	67%
IMG OID	641228956
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_594027
Protein GI	94971987
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAAG ATTCTTTCTC GGCTCTTCCC CATCCCGCCG CCACGCCGAC TGCTGGGTCC 
GCCTGGCCCG CGGGCAAGCC GCGCCACCTG ACGCTGCCGC GCACCGGCCT GATGCACAAC 
CTGCGGGTGA GCGCCGAGCG CTATCCGGAC AAGACCGCCC TGTGGTTTTA TGGCCGTGAG 
CTGAGCTACC GCGAGCTGCG CGAGCAGGCC GAGCGTCTGG CTGGGCACCT GGCCGCGCAG 
GGCGTGCAAA AGGGTGACCG GGTCGCGGTG TGGCTGCAAA ACAGCCCTGC CTGGGCGGTC 
GCGGCCCACG CCGCCTGGCA GCTCGGCGCG GTGGTGGTGC CGCTCGCGCC GATGCTGCAA 
GCCCGTGAAT TCGCCTACTT CCTGGGCGAC GCAGGCATCC GGGTTGGCGT GGTGGGGGCC 
GAACTGTACG AGCGGGCCAA ACAGGGCGGC CTTGAACACG CGGTTGTCGC CAATATCATG 
CGCGGCACCG ACCCCGCAAA GGCAGGGATT CCGCTGCCGA GCGGACTGGA CGTGAACCCC 
GAGCTGCAAG CGGGCGATGT AACGCTGGAA GAGGCCCTGA AGGCAGATGC TGCCCCCGCC 
GCCGAGATAG GGCCTGATGA CCTGGCGGTG ATGCCCTATA CCAGCGGCAC CACCGGAACG 
CCCAAGGGCT GCATGCACAC GCACGGGACC GTGCAAGCGA ATGTGTTCGG CGCGGGCGCC 
TGGGTCGACG GCACGGTGGA AGACGTGTTT CTGGCGAGCT TGCCCTTCTT CCACGTAACC 
GGTTTCGTCA ACAGCCTGCT CGCGCCCATC AACGGCGGCG GCAAGATTGT GATCATGGCC 
CGTTGGGACC GTGATGCAGC ACGTGAACTG ATCCGTGACC AGGGCGTCAC CCTCTGGACC 
AATACCGCGA CCATGGTGAT TGACCTGCTG GCCTCCCCGC ATTTCAATCC CTCGGACCTC 
CGCAGCCTGC GCAACGTGAC GGGTGGCGGG GCCAGTCTCC CGGCGGCGAT TGGCCAGCAG 
CTCCTCGACC AGACCGGCCT CACCTTCTGT GAGGGCTACG GCCTGACGGA GACGATGGCG 
CAGACCCACT CCAACCCCAA GAGCCGCCCC AAGCTCCAGT GTCTGGGGAT CCCACTGTTT 
GATGTCGATG CCCGGGTGGT GGACCTCGAC ACCGGCGAGG AACTTCCGGT GGGCGGCGTG 
GGCGAGATCG TGATTCACGG TCCCCAAGTG ATGAAGGGCT ACTGGAACCG CCCCGAGGCG 
ACCGCTGCGG CGTTCATGGA ACTGGACGGC AAACGTTTTT TCCGCACCGG CGACCTGGGC 
TACCGCGACG AAGAGGGTTA TTTCTTTTTC ACCGATCGCC TCAAGCGCAT GGTGAACGTC 
TCGGGCATGA AGGTGTGGCC CGCCGAGGTC GAAAACACGC TGCACGGGCA CCCCGCCGTG 
CAAGAAGCCT GCGTGATCGC GGTGCCCGAT GAGCGCACCG GCGAACGCGC CCGCGCCCTG 
ATCGTGCTGA AGCCCGGCCA ACAGGTGACC GGCGAGGAGA TCGAAGCGTG GGCCAGGACG 
CAGATGGCGA CCTACAAGGT GCCGCGCGAC TATGTGTTCG TGGAGAGCCT GCCGCGCGGC 
GCGACGGGCA AGGTGGCCTG GCGACAGCTC CAGGAACAGG CTCGCGCGGA GCTGGGTGCA 
CAGAAGTAG

Protein sequence

MTQDSFSALP HPAATPTAGS AWPAGKPRHL TLPRTGLMHN LRVSAERYPD KTALWFYGRE 
LSYRELREQA ERLAGHLAAQ GVQKGDRVAV WLQNSPAWAV AAHAAWQLGA VVVPLAPMLQ 
AREFAYFLGD AGIRVGVVGA ELYERAKQGG LEHAVVANIM RGTDPAKAGI PLPSGLDVNP 
ELQAGDVTLE EALKADAAPA AEIGPDDLAV MPYTSGTTGT PKGCMHTHGT VQANVFGAGA 
WVDGTVEDVF LASLPFFHVT GFVNSLLAPI NGGGKIVIMA RWDRDAAREL IRDQGVTLWT 
NTATMVIDLL ASPHFNPSDL RSLRNVTGGG ASLPAAIGQQ LLDQTGLTFC EGYGLTETMA 
QTHSNPKSRP KLQCLGIPLF DVDARVVDLD TGEELPVGGV GEIVIHGPQV MKGYWNRPEA 
TAAAFMELDG KRFFRTGDLG YRDEEGYFFF TDRLKRMVNV SGMKVWPAEV ENTLHGHPAV 
QEACVIAVPD ERTGERARAL IVLKPGQQVT GEEIEAWART QMATYKVPRD YVFVESLPRG 
ATGKVAWRQL QEQARAELGA QK