Gene Arth_3583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3583
Symbol
ID	4443894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4022593
End bp	4024344
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	67%
IMG OID	639691407
Product	long-chain-fatty-acid--CoA ligase
Protein accession	YP_833058
Protein GI	116672125
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGAAGA ACAGCAATGC CCAGCAGCCC GGGCACCTCT GGAGCGACCG CCCGTGGACC 
AGTTCCTACG GGCCGGGCGT GCCGGCCGAC CTGGTGCTGC CCCAGGGCTC ACTGGTGGAC 
CTCATGGACA GCTCCATACG TCGCTACGGG TCGAAGACCG CCCTTGAGTT CTTCGGCGCC 
CGCACCAGCT ACCGTGAGCT CGGCGCACTG ATCAGCAAGG CGGCCGCCGG TCTGAAGAAA 
CTGGGTGTCA AGGCCGGCGA CAGGGTTGCC CTGGTCATGC CGAACTGCCC GCAGCACATC 
GTCGCATTCC ATGCCGTGCT GCGTCTCGGC GCGGTGGTGG TCGAACACAA TCCGCTTTAC 
ACGGACCGGG AACTGCGCCA CCAGTTCGAG GACCACGGAG CCGCTGTCGC AGTTGTCTGG 
GACAAGGCGG TGGAGCGGGT CCGGCAGTTG CCGGCCGACG TCGGGCTCCG GAGTATCGTC 
TCGGTGGAGC TCATCCCGGC CATGCCCCTG GTGCAACGGC TGGCGCTGCG GCTTCCGGTT 
CCCGCGGCCC GCAAGGCACG CGGGGCCCTC ACCGTGGGAA AGGACCAGCC GAAGGGCCGG 
GCCGCTCCGG CTGCGCGGCC GGTTCTGCCC TGGCGGAAGC TCCTCGAATC CGGAGAGCTC 
AAGAAGAAGC ATCCGCGCCC CGCGCCCCAG GACCTCGCCG TCCTCCAGTA CACGTCCGGC 
ACCACCGGCT TGCCTAAGGG CGCCATGCTC AGCCACGCCA ACCTGCAGGC AAATGCGGCG 
CAGGGCCGCG CCTGGGTGCC GGGGCTCAAG GAGGGTCGGG AAACCGTCTA CGCAGTGCTG 
CCAATGTTCC ACGCTTACGG TCTGACGCTC TGCATGACCT TCGCCTTGAG CATCGGCGCG 
AAGCTGGTCC TGTTCCCAAA GTTTGATGTG GACCTCGTGT TAAGGGCGCT CAAGAGGTCC 
CCGGCGACCT TCCTGCCGGC CGTGCCGCCC ATTTATGACC GGATCGCGGC CGCGGCGGCT 
GAACGCGGCA TCGGGCTGGA AAGCATCCGA TACTCCATTT CCGGTGCCAT GAACCTTCCG 
ACGTCGACGG TGGAGACCTG GGAGAAGGCG ACAGGCGGCT ACCTGATCGA GGGCTACGGG 
CTGACCGAGA CGTCCCCGAT AGCGATCGGC AACCCTTTCG GCCCCAGCCG CAAGCCGGGC 
ACCGTCGGGG TGCCGTTCCC GCTGACCGAC ATCCGGGTGG TGGATCCCAG GAATGTTGCG 
CGGGACCGCG CCCCAGGCGA GGAGGGGGAA CTCCTGATCC GTGGTCCGCA GGTGTTCTCC 
GGCTACTGGA ACCGCCCGGA GGAGACCAAA GAGGCACTCC TCGACGGCGG CTGGTTCCGC 
ACCGGCGACA TCGTCTCCGT GGACGACGAC TACTTCGTCA CGATCCGGGA CCGGATCAAG 
GAGCTGATCA TCACGGGCGG GTTCAACGTC TCACCCAGCG AGGTGGAGGA CGTCCTTGCC 
ACGTTCCCCG GTGTTTCGGA AGTCTCCGTG GTCGGGTTGC AACGCCCGAG TGGCGGCGAG 
GACGTGGTCG CCGCAGTAGT GCCCATCCCG GGCACCACCA TTGATCCGGA CGCGCTCCTG 
GCCTTTGCCC GGAAGCACCT GACCGCATAC AAGGTGCCGC GCCGGGTGGT GGTGCTTGAT 
TCCCTCCCGC GCTCGCTCAT AGGCAAGGTC CTCCGTCGTG AGATCCGGGA CACCCTCGTG 
GCCGGGCGGT GA

Protein sequence

MKKNSNAQQP GHLWSDRPWT SSYGPGVPAD LVLPQGSLVD LMDSSIRRYG SKTALEFFGA 
RTSYRELGAL ISKAAAGLKK LGVKAGDRVA LVMPNCPQHI VAFHAVLRLG AVVVEHNPLY 
TDRELRHQFE DHGAAVAVVW DKAVERVRQL PADVGLRSIV SVELIPAMPL VQRLALRLPV 
PAARKARGAL TVGKDQPKGR AAPAARPVLP WRKLLESGEL KKKHPRPAPQ DLAVLQYTSG 
TTGLPKGAML SHANLQANAA QGRAWVPGLK EGRETVYAVL PMFHAYGLTL CMTFALSIGA 
KLVLFPKFDV DLVLRALKRS PATFLPAVPP IYDRIAAAAA ERGIGLESIR YSISGAMNLP 
TSTVETWEKA TGGYLIEGYG LTETSPIAIG NPFGPSRKPG TVGVPFPLTD IRVVDPRNVA 
RDRAPGEEGE LLIRGPQVFS GYWNRPEETK EALLDGGWFR TGDIVSVDDD YFVTIRDRIK 
ELIITGGFNV SPSEVEDVLA TFPGVSEVSV VGLQRPSGGE DVVAAVVPIP GTTIDPDALL 
AFARKHLTAY KVPRRVVVLD SLPRSLIGKV LRREIRDTLV AGR