Gene Arth_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1080
Symbol
ID	4446418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1166725
End bp	1167984
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	68%
IMG OID	639688886
Product	Formyl-CoA transferase
Protein accession	YP_830574
Protein GI	116669641
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.982565
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCG TGACCCTGGA AACGGCAGAG CTGGAACGCA CGACGGCGGC GCCCGCCGCC 
GCGGGGGAAC CCACCGCCAC CCCGCTGCCG CTGGACGGCA TCAAGATCGT GGACTTCACC 
CAGGTGTTCA TGGGCCCGTC CTGCACGCAG ATGCTGGGCG ACTATGGCGC GGACATCATC 
AAGGTGGAAC GCCCCGGCGC CGGGGACATC TCACGCAACT CGTTCCCGGA CAAGGACGGC 
CAGGACAACC CGATCTTCCT GTCCATCAAC CGGAACAAGC GCAGCGTCTC CATCGACACG 
CGCACCGAGG AAGGCCGGAA CGTGCTGCAC GCCATCATGG CGGACGCCGA CGTGGTGGTC 
AGCAACTTCC GCTCCGGTGT GATGGAGCGG ATGGGCTTCG GCTACGAGGA ACTCAAGGCC 
GAGAACCCCG GCATCATCTG GGCCTCGGGC ACCGGCTTCG GCCCCGTGGG CCCGTACTCG 
CACAAGGGCG GCCAGGACGC GATCGCGCAG GCCTACTCCG GTGTGATGTG GCGGCGGGAA 
TCGGACGACC AGAAGCCGTC CATCTACCCC ACCACCCTCT GCGACTACAT CACCGGCATG 
CACCTCATGC AGGGCATCCT GCTGGCACTG CGCACCCGGG AAACCTCCGG CGTCGGCCAG 
AAGGTGGAGG TGACCATGTA CGACTCCATG CTGCACCTGC AGATGCAGGA GGCGTGCATG 
CAGCTCAACC GCGGCTACGA GGTCAACTGG GGCGCCATGC CGCTCAGCGG AGTGTTCGAG 
ACCACCGACG GCGCCGTCTG CATGGTGGGC GGTTTCACTC CGGACCCGCT GGCCCGCATC 
TCCGAAGCCC TCGGGCTGGA CGAGGACCTT ACGCAGCGGC CCGAGTTCGC CAACCTGGAG 
CAGCAGTTCG CGCACAAGCC GGCGCTGCAG GCCATCTTCC GCGAGCGCAT CGCCACCAAC 
ACCACCGAGT ACTGGACCGG CAAGCTGGAA GACCAGGGGC TGCTCAACGC CCCGGTCCAC 
ACCCTGGAGC AGGCCCTGGC CGATGCCCAG ACCGAGGCCA ACGGCATGAT CGTCGAGGCC 
GAACACCCCG GCGTCGGGAC CGTGCGCATG CTCAACGCGC CCATCCGGCT CTCCGCCACG 
CCTCCCACCG TCCGGCGCGC GGCGCCCCGG CTGGGCGAGC ACAACGTGGA GGTCCTGCTG 
GAGAACGGGT TCGATGAGGA GACCATCGCG CGGCTGCAGC AGCTGGGGGT GCTCCGGTGA

Protein sequence

MSTVTLETAE LERTTAAPAA AGEPTATPLP LDGIKIVDFT QVFMGPSCTQ MLGDYGADII 
KVERPGAGDI SRNSFPDKDG QDNPIFLSIN RNKRSVSIDT RTEEGRNVLH AIMADADVVV 
SNFRSGVMER MGFGYEELKA ENPGIIWASG TGFGPVGPYS HKGGQDAIAQ AYSGVMWRRE 
SDDQKPSIYP TTLCDYITGM HLMQGILLAL RTRETSGVGQ KVEVTMYDSM LHLQMQEACM 
QLNRGYEVNW GAMPLSGVFE TTDGAVCMVG GFTPDPLARI SEALGLDEDL TQRPEFANLE 
QQFAHKPALQ AIFRERIATN TTEYWTGKLE DQGLLNAPVH TLEQALADAQ TEANGMIVEA 
EHPGVGTVRM LNAPIRLSAT PPTVRRAAPR LGEHNVEVLL ENGFDEETIA RLQQLGVLR