Gene Arth_4031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4031
Symbol
ID	4447867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4550450
End bp	4551877
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	66%
IMG OID	639691862
Product	hypothetical protein
Protein accession	YP_833506
Protein GI	116672573
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAGG CCACGCCCTC AGGAAGCGGC GGACAGCTAC CACCGCTGGA GCCGGCAACG 
GACGGCAGCA TGCGGATCCG CGGCGGAGTC GGAGGAATCA GCTTTCAACT GGAAGAGCTC 
ATGGCCGGTG TGGCTGAACT TGACGGCATG GCTGACGAAC TCGCCGCGGT TGAGATCGGG 
GTCCGGCGGA TCTGGGAAGA ACTGTGTCCC TACGAGAACG ATCCCCGAAC AAGCGGCACG 
GCCGCACTGA TTGCGGTGGG TGAAGGGGGC CAGGCGGTCC GCGCCGTCAG GGAAGAACTC 
CAACACCTCA GCAGCCAGGT CCGGGCGAGC CGCCGGGACT ACGAAACGGC AGAGTCATTG 
GCCGCCGCGG GGGTCCGCAT GCCGGACGAC GGCTGGGGCT TCCTGCCTGC GCTCTATCTG 
GACCTGAAGA CCACGTTTGT GCCGAGCCGC GACGCTGCCG AGGCGCTCGC GGCGCCTTTG 
TCACTCGCAC TGATGATAGG AATTTCCCCT GCGGAGCTGG CTCGCGCGTT GGCAGCCGAG 
GTTGCAGCGG GCCGGGGTTT CCTGGCCATT GGCCCGTTGA TGCGGAGGCT GGCGGAGGGC 
ACGCTTCCCT TCCTCAAGCC GCGTCCCGTC ACGGCCGTCG AGGAACTCAC CCGGGATGTG 
GTCGTGGACA CCTCGCCCGC CGGCCTCCTC GCCAGGCTTC GCGAACTTGA CGCTGAGGGC 
CACGGAAAGA TCGAGGTGGT GCAAGTGGAG GCGGACGGCC GAAAAGCGTA TATCGTCATC 
ATCCCGGGAA CCCAGCCCGG GGATCCGGCA GGGGGTTCGA ACCCGCTGGA TGAGGCCGGG 
ATTGCTGAGG CGCTGGGCTA TGGCTCGGAA TACCTGAATG CTGCCGTGCT GTCGGCATTG 
CACCAGGCCG GTGCAGTCAA AGGGGATCAG GTAGTGGCTG TGGGCTACAG CCAGGGCGGG 
GCACATGCCA TGAACCTCAG CAGTGACAAG GCGTTCCTCG CCGAATTCGA CCTGAAGTAT 
GTGCTGACGG CCGGTTCACC GGTGGGCGCG ATTTCGCCGG CACCGGGAAT CACGTCCCTC 
CACCTCGAAC ATCGCCAGGA TTGGGTTCCC GGTAGTGACG GAACTCCTAA CCCGGACACC 
AGGGAAAGGG TCACCGTCAC GCTGACCGAC AGGGTGTTCA GGCCGCCGGG TTTTGATCTC 
AACCTGGGGC CGGGCCACAA CATTGGCAAC TACGAGGAGG GCGCCAAGGC AGTGTCGGCC 
AGCAAAGACC CGTCCCTGGT CGCGAACACG GCGGTCCTCG CCGGCGTTGT TGGCGCGGGA 
GGGGCAGGGA CCGCCACCCG CTTTGCCGTA AACCGGGAAC CGAAGGCCCC GACGGCGCGC 
CAGCAGGACA GGCCGCTCCA AGGGGCAGCC AGGTGGGTCG GCCGCTAG

Protein sequence

MAEATPSGSG GQLPPLEPAT DGSMRIRGGV GGISFQLEEL MAGVAELDGM ADELAAVEIG 
VRRIWEELCP YENDPRTSGT AALIAVGEGG QAVRAVREEL QHLSSQVRAS RRDYETAESL 
AAAGVRMPDD GWGFLPALYL DLKTTFVPSR DAAEALAAPL SLALMIGISP AELARALAAE 
VAAGRGFLAI GPLMRRLAEG TLPFLKPRPV TAVEELTRDV VVDTSPAGLL ARLRELDAEG 
HGKIEVVQVE ADGRKAYIVI IPGTQPGDPA GGSNPLDEAG IAEALGYGSE YLNAAVLSAL 
HQAGAVKGDQ VVAVGYSQGG AHAMNLSSDK AFLAEFDLKY VLTAGSPVGA ISPAPGITSL 
HLEHRQDWVP GSDGTPNPDT RERVTVTLTD RVFRPPGFDL NLGPGHNIGN YEEGAKAVSA 
SKDPSLVANT AVLAGVVGAG GAGTATRFAV NREPKAPTAR QQDRPLQGAA RWVGR