Gene Arth_3951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3951
Symbol
ID	4447769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4464695
End bp	4465804
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	68%
IMG OID	639691782
Product	nitrate reductase (NADH)
Protein accession	YP_833426
Protein GI	116672493
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAAGC AGATTTCCCG GCGCCGTCAG TCCGTGAAGC CCGCGGCGCA CTCAGGAGAG 
CCCACCCACG GTCCGCTCAC CGCAGAGGAA CTGCAGCTGG CCGTCAGGAA CCATTCGATG 
CCATTGGAGG CCTTGCGGGA GGCCACCACA CCGCCGGGGC TGCACTACGT CCTGACGCAC 
TTCGACATCC CGTTCATTGA CGCCGACTCC TGGCACCTGC GGATCGGCGG TGCCGTGCAG 
CGCGCCGTCG AGATCAACCT CCGGGCGCTT CGCCGGGACC CGACCATCAG CATTCCGGTC 
ACGCTGGAGT GCGCCGGCAA CGGCCGCTCG CTGCTGCATC CGCGGCCGCT GAGCCAGCCG 
TGGCGGCTCG AGGGCGTGGG AACGGCGGAG TGGACCGGGG TTCCGCTCGC GTACCTGCTG 
GCCCAGGCCG GCGTTGACGA GGACGCCGTC GAAGTGGTGT TCACCGGCGC CGACGCCGGC 
ATCCAGGGCG GAGTCCGGCA GACGTATGCG CGCAGCCTTC CGATCAAGGA GGCGATGCGC 
CCCGATGTCG TCCTGGCGTA TGAGATGAAC GGTCGCGAGC TGCCGCCGCA GCACGGCTAC 
CCCCTGCGCC TTGTGGTCCC TGGCTGGTAC GGCATGGCCA GCGTGAAGTG GCTGGAGTCC 
ATTCAGGTGC TGACCCATCC GTTCGAGGGA TTCCAGCAGT CGGTGGCGTA CCGCTACCAG 
AAGGACGCGG ACGACGCCGG CACTCCGGTC TCCCGGATCA AGGTGCGTTC GCTGATGATT 
CCGCCGGGCA TCCCGGACTT CTTCACCCGC AGCAGGGTCC TCTCCGCCGG CCCGGTCATG 
CTTACGGGCA GGGCCTGGTC CGGTGAAGGC TCCGTGGTCC GCGTGGAAGT GGGGATTGAC 
GGGAAATGGG TGACCGCGCA CCTCGGACAC CCGGCGGGGC CGTTTGCCTG GTGCGAATGG 
ACGCTGCCGT GGGTGGCGGA CCGGGGCGAG CATGAGCTCG CTTGCCGGGC CACCGACGCC 
ACGGGATCAA CGCAGCCGCT GGAGCAGGTC TGGAACTACC AGGGCATGGG CAACAACGTG 
GTGCAGCGCG TGAAGGTGAG CGTCGAGTAG

Protein sequence

MTKQISRRRQ SVKPAAHSGE PTHGPLTAEE LQLAVRNHSM PLEALREATT PPGLHYVLTH 
FDIPFIDADS WHLRIGGAVQ RAVEINLRAL RRDPTISIPV TLECAGNGRS LLHPRPLSQP 
WRLEGVGTAE WTGVPLAYLL AQAGVDEDAV EVVFTGADAG IQGGVRQTYA RSLPIKEAMR 
PDVVLAYEMN GRELPPQHGY PLRLVVPGWY GMASVKWLES IQVLTHPFEG FQQSVAYRYQ 
KDADDAGTPV SRIKVRSLMI PPGIPDFFTR SRVLSAGPVM LTGRAWSGEG SVVRVEVGID 
GKWVTAHLGH PAGPFAWCEW TLPWVADRGE HELACRATDA TGSTQPLEQV WNYQGMGNNV 
VQRVKVSVE