Gene Arth_1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1547
Symbol
ID	4445948
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1723664
End bp	1725523
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	65%
IMG OID	639689362
Product	AMP-dependent synthetase and ligase
Protein accession	YP_831041
Protein GI	116670108
COG category	[I] Lipid transport and metabolism
COG ID	[COG1022] Long-chain acyl-CoA synthetases (AMP-forming)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.174488
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAACA AAGGAGCTAT CGTGCGCGAA TTCAGTGTTC CGCCCTTGGT GAATGTACCC 
CCGGAAACCA ACATCACCGA CCTGGTGTTG CGGCAGGCCG CCAAGGCCTC GAACCCGTCC 
CTGTTTTCGC GGCTCGATGC CGCCGGACAG TGGCAGGATA TTTCTGCCAC GGATTTCCTC 
GCCGACGTGC GCATCCTGGC CAAGGGCCTC ATGGCCAGCG GAGTGGCAGC AGGCGATCGC 
GTCGGCATCA TGTCCCGCAC CCGCTACGAG TGGGCGCTGG TCGACTTTGC GATCTGGTTT 
GCCGGTGGCA TCTCCGTTCC CATCTACGAA ACCTCCTCCC CCAGCCAGGT CGCCTGGAAC 
CTGGGCGACT CGGGTGCCGT CGCGGCCTTC GGCGAGTCGG CGCACCACGA GGACATCATC 
CGGCAGGCCG CAACCTCGGA AGGGCTTTCA TCCCTGGCCC ACGTCTGGCA GCTTGAGGGC 
GCCGGGCTGG ACGAGCTCCG CGCGGCCGGC ACCACCGTCA GCGACGAGGA GCTCGAAGCC 
CGCAGGAGCC TGGCTTCGCT GGCCGACGTC GCGACGATCA TCTACACCTC CGGCACCACC 
GGACGGCCCA AGGGCTGCGA GCTGACGCAC GGGAACTTCG TGGAGTTGTC CGAGAATGCA 
CTGGCCACCT CGCTCTCAGG CATCGTCCAC GAGCAGGCAC GAACCATCAT GTTCCTGCCA 
CTCGCACACG TTTTCGCCCG GTTCATCTCG GTCCTGGCCG TGGCTGCCGG CGTCACTGTG 
GCGCACACCC CGGACATCAA GCACCTCCTG CCGGACCTGC AAAGCTACAA GCCCACGTTC 
ATCCTCGCCG TCCCGCGCGT ATTCGAAAAG GTCTATAACT CCGCGCTGAC CAAGGCCGAG 
GACAGCGGCA AGGGCGCCAT CTTCCACAAG GCAGCCGACA CCGCCATCGC CTACTCGCGG 
GCCCGGCAGG CCGGTTCCAT CGGCTTCGGC CTCAAACTCC GCCACGCGCT GTTCGACAAG 
CTTGTCTATA GCAAGCTCCG CGCGGCCATG GGCGGCCAGG TGGCACACGC AGTGTCCGGC 
GGCGGTCCGC TGGGTGAACG CCTGGGGCAC TTCTTCCAGG GCATCGGCAT GCAGATCCTT 
GAAGGCTACG GCCTGACCGA AACCACCGCG CCGATCACGG TCAACACTCC CTCGCTCATC 
AGGATCGGGA CGGTGGGCGC TCCCCTGCCG GGGAATGCGG TGAAAATAGC CGACGACGGC 
GAGATCCTCG CCAAGGGCGT CTGCGTGATG CGCGGCTACT ACAAGCGCGA CGACCTCGCA 
GCCGACACGT TCGTGGACGG CTGGTTCCGC ACGGGCGACA TCGGACAAAT GGACGCCGAC 
GGCTTCCTGA CCATCACAGG CCGCAAGAAG GAAATCATCG TGACGGCCAG CGGCAAGAAC 
GTGGTGCCTG CCCTGCTGGA AGACCAGATC CGGGCCGACG CCCTCGTCTC CCAGGTGCTG 
GTTGTGGGCG ACAACATGCC GTTCATCGGA GCCTTGGTGA CACTCGATGA GGAAGCCCTG 
CCGGGATGGC TGCAGCGTCA CGGACTTCCG GCCGGCACCA CGGTCGCGGA AGCGGCAGGC 
CATCCGGTGG TCAAGGCTGC CGTCCAGGAC CTCATCACCC GCGCCAACCA GTCAGTGTCC 
CAGGCGGAAG CCATTAAATC GTTCCGGATC GTACCGTCTG ATTTCACCGA GGCATCCGGC 
CATCTCACCC CCTCCATGAA GGTCAAGCGG GCCCAGGTGA TGAAGGACTT CGACGCCGTC 
ATCGCGGACA TGTACGCTAC ACCGCGGCCG GCCCGTACGG AGCCGTCCGG ACAGCACTAG

Protein sequence

MDNKGAIVRE FSVPPLVNVP PETNITDLVL RQAAKASNPS LFSRLDAAGQ WQDISATDFL 
ADVRILAKGL MASGVAAGDR VGIMSRTRYE WALVDFAIWF AGGISVPIYE TSSPSQVAWN 
LGDSGAVAAF GESAHHEDII RQAATSEGLS SLAHVWQLEG AGLDELRAAG TTVSDEELEA 
RRSLASLADV ATIIYTSGTT GRPKGCELTH GNFVELSENA LATSLSGIVH EQARTIMFLP 
LAHVFARFIS VLAVAAGVTV AHTPDIKHLL PDLQSYKPTF ILAVPRVFEK VYNSALTKAE 
DSGKGAIFHK AADTAIAYSR ARQAGSIGFG LKLRHALFDK LVYSKLRAAM GGQVAHAVSG 
GGPLGERLGH FFQGIGMQIL EGYGLTETTA PITVNTPSLI RIGTVGAPLP GNAVKIADDG 
EILAKGVCVM RGYYKRDDLA ADTFVDGWFR TGDIGQMDAD GFLTITGRKK EIIVTASGKN 
VVPALLEDQI RADALVSQVL VVGDNMPFIG ALVTLDEEAL PGWLQRHGLP AGTTVAEAAG 
HPVVKAAVQD LITRANQSVS QAEAIKSFRI VPSDFTEASG HLTPSMKVKR AQVMKDFDAV 
IADMYATPRP ARTEPSGQH