Gene Arth_3912 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3912
Symbol
ID	4444552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4406829
End bp	4408568
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	66%
IMG OID	639691737
Product	protein of unknown function DUF853, NPT hydrolase putative
Protein accession	YP_833387
Protein GI	116672454
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCATCA AATCCACTGC AGATAAAGTC GCCACCATCC AGAAGGGATA CACCCTGGAC 
GGCGCCACCA TCGAACTGGG GGCCGCGATC GTCGACGGCG AGCTCCACAA GGACGCCCCC 
GTCCGGCTGC CCCTGGCCAT GATGAACCGG CACGGACTGG TGGCCGGCGC AACAGGTACC 
GGCAAGACCG TCACGCTCCA CATGATGGCG GAGCAGCTGT CCACGGCCGG GGTGCCGGTG 
TTCCTCGCCG ACATCAAGGG AGACCTTTCC GGGCTGGCCA CCGCCGCAAC CGGCAGCGAA 
AAACTGAAAG CGCGCACGGA CAGCATCGGC CAGGCCTGGG CGGGCAGAAC TTTTCCCGTG 
GAATTCCTGG CTCTCGGCGG CGACGGCAAC GGCATCCCTG TCCGGGCCAC CATCACTTCT 
TTCGGCCCCA TCCTGCTCTC GCGGATCATG GAGCTCAACG ACACCCAGGA ATCCAGCCTG 
CAGCTCGTTT TCCACTTTGC GGACAAGAAC AACCTGGAAC TGATCGACCT CAAGGACCTC 
AGGGCGGTCA TCCAGTTCCT CACGTCGGAC GAGGGCAAGG ACGAACTCGA GGCGCTGGGC 
GGGCTCTCCA AGGCGACGGC CGGCGTCATC CTCCGCGAAC TGGTGACCCT TGAGGCACAG 
GGCATGGAAG CATTCTTCGG CGAGCCCGAA TTCGACACCG CCGAACTGCT GCGCACCGCC 
CCTGACGGCC GCGGCGTCAT CACCTGCCTG GAACTGCCCA CGCTGCAAAC CAAGCCCATG 
GTGTTCTCCA CCTTCCTGAT GTGGCTGCTC GCGGACCTGT TCGAGGACCT GCCCGAAGCC 
GGGGATCTGG ACAAGCCCAA ACTGGTCTTC TTCCTCGACG AGGCACACCT GCTCTTCAAC 
GATGCCTCCA AGGCGTTCCT GGAGGCGATT ACCACCACTG TCCGGCTCAT CCGTTCCAAG 
GGCGTGGGCA TCTTCTTTGT CACCCAGACG CCCAAGGACG TGCCGGCCGA TGTCCTGGGG 
CAGCTGGCAA ACCGCATCCA GCACGCCCTG CGCGCGTTCA CCCCGGAAGA CGCCAAGGCC 
CTGAAAGCCA CCGTGTCCAC GTTCCCGGTG AGCGACTACG ACCTCGAGGA AACGCTGACC 
TCGGCCGGAA TCGGTGAAGC CGTCATCACG GTGATGAATG AAAAGGGCGC CCCCACCCCG 
GTGGCATTGA CCCGCCTCCG CGCCCCGGAA TCCTTGATGG GCCCCAGCAC GGAGGACCTC 
GTCAAGAGCA CCGTGGCCGG TTCCGCGCTG CTCGTAAAAT ACGGCACGGC CGTGGACAAG 
GTCTCCGCCT ACGAGAAGAT CTCAGGAAAG GGCGCCGCCC CCACGGGAGC CGCGGCGCCC 
GGGCAGCCTC CCGCTCCGAA CTCGGAAATT TTTGTGCCCA ATAGCCCCGC GCCCGGTAGC 
CCTGTTCCCG GAACCATGGA CCAGGCCTCC GTGGACGCCG ATGCCCGGCG CATCGAGGAA 
GATATCCTGG GCCGCCCCAG CAGCAGACCC GCCCCGGTAC CGGAACGGCC ACGCAGCGGC 
GAACGCACAG CGCCGCAGGC CCGGAAGGAA TCAGGCGGAA GCATGGCTGA CGATCTCGCC 
GGAGCCTTGG GCGGCGCGCT GGGCGGCGGC CTCAAAAGCA TGGCCCGCTC GCTCGGAACC 
CAACTGGGCC GGGAGCTGTT GCGGGGCGTC TTCGGCACGT CCTCCCGCCG CCGCCGGTAG

Protein sequence

MAIKSTADKV ATIQKGYTLD GATIELGAAI VDGELHKDAP VRLPLAMMNR HGLVAGATGT 
GKTVTLHMMA EQLSTAGVPV FLADIKGDLS GLATAATGSE KLKARTDSIG QAWAGRTFPV 
EFLALGGDGN GIPVRATITS FGPILLSRIM ELNDTQESSL QLVFHFADKN NLELIDLKDL 
RAVIQFLTSD EGKDELEALG GLSKATAGVI LRELVTLEAQ GMEAFFGEPE FDTAELLRTA 
PDGRGVITCL ELPTLQTKPM VFSTFLMWLL ADLFEDLPEA GDLDKPKLVF FLDEAHLLFN 
DASKAFLEAI TTTVRLIRSK GVGIFFVTQT PKDVPADVLG QLANRIQHAL RAFTPEDAKA 
LKATVSTFPV SDYDLEETLT SAGIGEAVIT VMNEKGAPTP VALTRLRAPE SLMGPSTEDL 
VKSTVAGSAL LVKYGTAVDK VSAYEKISGK GAAPTGAAAP GQPPAPNSEI FVPNSPAPGS 
PVPGTMDQAS VDADARRIEE DILGRPSSRP APVPERPRSG ERTAPQARKE SGGSMADDLA 
GALGGALGGG LKSMARSLGT QLGRELLRGV FGTSSRRRR