Gene Arth_3862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3862
Symbol
ID	4447561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4344622
End bp	4345848
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	68%
IMG OID	639691686
Product	carboxylate-amine ligase
Protein accession	YP_833337
Protein GI	116672404
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02050] uncharacterized enzyme

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAACTT TCGGGGTTGA GGAAGAGCTG CTGATTGTGG ACCCCGTGAC CGGGGAGCCG 
CTGGCACTGG CGGACGCCCT GCTGACAGGG CGGAAGCTTG CTGCGGACGA TGCTCCGGAC 
AAACCCCGGA TCCTGGACCC CCACGATCCA ACCCGTGACG ACGGCGACAC CGGGCTCACT 
GCCGAACTGA AACTTGAACA GATCGAGACG CAGACCCGTC CGTGTCTGAA CTATGAGGAG 
CTGCTCCTCC AGATCCGCCA GGGCCGGGCC CTGGCAGATA CCGCCGCGGA GAAACACAAT 
GCGCGGGTGG CCGCGCTGGC AACATCGCCG ATTGCCTCCA CGACGCACAC CACACCGAAC 
CCCCGCTATG CCACCATGCA GGAACGCTTT GGCCTCACCG TCCATGAGCA GCTGACCTGC 
GGTTTCCATG TCCACACCTT CGTCGAATCC CCGGAAGAAG GCGTGGCTGT CATCGACCGG 
CTCAGGGACA AGCTGGCGGT GCTCACGGCG CTCAGCGCAA ATTCGCCGTA CTGGAACGGC 
GTGGAGACCG GCTTCGAGAG TTACCGCACG CAGGCCTGGA ACCGCTGGCC GACGTCGGGC 
CCGTCCCAGA TCTTCGGGAC GCACTCCATG TACCGCCGCG TGGTCACCCG GCTGCTGGAC 
AGCGGCGTGC TGCTGGACGA GGGCATGATC TATTTTGATG CGAGGCTCTC CCGGAACCAC 
CCCACCGTGG AAGTCCGGGT GGCGGACGTT TGCCTGCAGG CCGAGGACGC CGCCCTGATC 
GCCGTGCTGG TGCGGGCGCT GGTGGAATCG GCCAGCAGGG AATGGCGGGC CGGTGTAGAC 
CCCGCGCCCG TGCCGACGGT GCTCCTGCGG ATGGCCGCGT GGCAGGCAAG CAACTGCGGA 
CTCCGGGGAG ACCTTCTGGA TTTCGGCACG TTCCGCCCCG CTCCCGCCGA GGAAGTCGTG 
GAGGCGCTGG TGGACTACGT CGCGCCCGTC CTGGCGGAAC AGGACGAGCT GGAACTGGCC 
TGGGAAGGCG TGCGGAGGAT CCTGGACCGG GGGACCGGTT CGGAACAGCA GCGGCTTGCC 
ATGCAGGAAT GCCTTGCCGG GAACCCGGAG GCCGCCGCCG GGCTGGCCGC CGTGGTTGCC 
CACGCGGTGG ACGTGAGCAT GCGCCGGACC GAAGCCGTCA CCGCGCGCGA GAAGGCGCCG 
GTGCTGCTGC GCGTTCGCCA GTCCTGA

Protein sequence

MRTFGVEEEL LIVDPVTGEP LALADALLTG RKLAADDAPD KPRILDPHDP TRDDGDTGLT 
AELKLEQIET QTRPCLNYEE LLLQIRQGRA LADTAAEKHN ARVAALATSP IASTTHTTPN 
PRYATMQERF GLTVHEQLTC GFHVHTFVES PEEGVAVIDR LRDKLAVLTA LSANSPYWNG 
VETGFESYRT QAWNRWPTSG PSQIFGTHSM YRRVVTRLLD SGVLLDEGMI YFDARLSRNH 
PTVEVRVADV CLQAEDAALI AVLVRALVES ASREWRAGVD PAPVPTVLLR MAAWQASNCG 
LRGDLLDFGT FRPAPAEEVV EALVDYVAPV LAEQDELELA WEGVRRILDR GTGSEQQRLA 
MQECLAGNPE AAAGLAAVVA HAVDVSMRRT EAVTAREKAP VLLRVRQS