Gene Arth_4024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4024
Symbol
ID	4447825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4542540
End bp	4544132
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	66%
IMG OID	639691855
Product	AMP-dependent synthetase and ligase
Protein accession	YP_833499
Protein GI	116672566
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTCTCAA GCCCCTTTTC GGATGTTGTC ATCCCGGACC AAAGCGTTTA TGAGTACCTC 
TTCGGGGGTC TCACGGAAGC GGATCTGGAC CGGACCGCCG TCGTAGACGG CAGCAGCGGC 
GCGGAAACCT CCTACCGCCA GTTGCTGGAA CAGATCGACG CCGTGGCGGG AGCAGTCTCC 
GCACAGGGAC TAGGTCCGCA CGGGGTTGCC GCAATCCTCT GCCCCAACGT CCCGGCGTTC 
GCTGCCGTCT TCCACGGCCT GCTCCGGGCC GGCGCCACCA TCACCACCAT TAACTCGCTC 
TATACCGCCG ATGAAATCAC GCTTCAGCTG CAGGACGCCG CTGCAACGTG GCTGTTCACG 
GTGTCCGCCC TGCTTCCGGG TGCCGTGCAG GCGGCCGAGC GTGCCGGGAT CCCGGCGGAC 
CGGCTCGTGG TGCTCGACGG CGCCCCGGGT CACCCCTCGC TGAAGGACCT GCTCACCGCC 
GGAGCGCCGG TACCTGCCGT TTCCTTCGAC CCGGCCACCC ATGTGGCCGT GCTGCCGTAC 
TCCTCCGGTA CCACCGGGCG GCCCAAAGGC GTGAAGCTCA GCCACCGCAA CCTCGTGGCC 
AACGTGGAAC AGTCCCGCGG GCTTCTGAAG GTGAAGCCGC AGGACCGGCT TCTTGCCCTG 
CTGCCGTTCT TTCACATCTA CGGGCTTACT GTCCTGTTGA ACCTCGCACT GCGGGAACGG 
GCCTGCCTGG TCACCATGCC CCGGTTCGAC CTCGCCGAGT TCCTGCGCAC CATCCAGGAC 
CACAAATGCA CGTACCTGTT CATCGCGCCG CCGGTGGCCG TGGCGTTGTC CAAACACCCG 
CTCGTTGCGG AGTACGATCT CAGCTCCGTC CACACCACGC TGTCCGGTGC CGCGCCGCTC 
GACGGGGAAC TCGGCGCCAC GCTCGCCGAA CGCCTCCATT GCCGTGTGCT GCAGGGTTAC 
GGGATGACGG AGATGAGTCC TGTGTCGCAC CTGATCCCGG TGGATGCGCC GGACGTTCCG 
GTGAGCTCGG TGGGCTTCAC GGTGCCCAAC ATGGAATGCC GGCTGGTGGA CCCTGCCACA 
GGCGAGGACA TCGACATCCC GGCGGAGGGA ACCAGTGCCC CGGGCCACCT GCTGTGCCGG 
GGACCGAATG TCATGCTTGG ATACCTCAAC CGTCCGGAGG AAACGGCCGA CACCCTGGAC 
CCGGACGGTT TCCTGCACAC TGGTGACATC GCGACAGTCC GGGCCGACGG TGTGGTGACC 
ATCGTGGACC GGCTGAAGGA ACTCATCAAA TACAAGGGAT ACCAGATCGC ACCGGCCGAA 
CTTGAGGCGC TGCTGCTGTC GCACCCGGGC ATCGCCGATG CCGCCGTGAT TGGGACACCC 
GACGCCGACG GCCAGGAAGT GCCGATGGCC TTCGTCGTGC GTCAGCCGGG CGCGGAAGGG 
GAAGCGCTCG ATGAAGACGG CGTCATCGAC TTCGTGGCCT CCCGGGTGGC ACCCTTCAAG 
AAGATCCGCC GGGTGGAGTT CATCGAGGCC GTGCCCAAGT CCGCCTCCGG GAAGATTCTT 
CGCAGGATGC TCAAGACGGC CCAGTCGGCC TGA

Protein sequence

MFSSPFSDVV IPDQSVYEYL FGGLTEADLD RTAVVDGSSG AETSYRQLLE QIDAVAGAVS 
AQGLGPHGVA AILCPNVPAF AAVFHGLLRA GATITTINSL YTADEITLQL QDAAATWLFT 
VSALLPGAVQ AAERAGIPAD RLVVLDGAPG HPSLKDLLTA GAPVPAVSFD PATHVAVLPY 
SSGTTGRPKG VKLSHRNLVA NVEQSRGLLK VKPQDRLLAL LPFFHIYGLT VLLNLALRER 
ACLVTMPRFD LAEFLRTIQD HKCTYLFIAP PVAVALSKHP LVAEYDLSSV HTTLSGAAPL 
DGELGATLAE RLHCRVLQGY GMTEMSPVSH LIPVDAPDVP VSSVGFTVPN MECRLVDPAT 
GEDIDIPAEG TSAPGHLLCR GPNVMLGYLN RPEETADTLD PDGFLHTGDI ATVRADGVVT 
IVDRLKELIK YKGYQIAPAE LEALLLSHPG IADAAVIGTP DADGQEVPMA FVVRQPGAEG 
EALDEDGVID FVASRVAPFK KIRRVEFIEA VPKSASGKIL RRMLKTAQSA