Gene Arth_1336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1336
Symbol
ID	4446140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1498294
End bp	1499472
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	639689144
Product	nifR3 family TIM-barrel protein
Protein accession	YP_830830
Protein GI	116669897
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACTGTTG TAGCGACTCC TCCCGCCCCC AAGCTGGAAC TCCCGCCCCT GAAGCTGGGA 
CCCCTCACGG TGGACACCCC CGTGATCCTG GCCCCCATGG CGGGCATCAC CAACTCCGCC 
TTCCGCAGGC TCTGCCGTGA ATACGGCGGC GGCATGTACG TGGCGGAGAT GGTCACCTCG 
CGTGCCCTCG TGGAGCGCAC CCCCGAGTCG CTGCGGATCA TCTCCCACGA CGACGACGAA 
AAGGTCCGCT CCGTCCAGCT GTACGGCGTG GACCCCGTGA CCGTCGGGCA GGCGGTCCGG 
ATGCTTGTCG AGGAGGACCG GGCGGACCAC ATCGACCTCA ACTTTGGCTG CCCCGTTCCC 
AAGGTGACCC GGCGCGGCGG CGGATCAGCC CTGCCCTGGA AGATCGACCT GTTTACCTCG 
ATCGTCCAGA CGGCCGTCAA AGAGGCGTCC AAGGGCAACG TCCCGCTCAC CATCAAGATG 
CGCAAGGGCA TTGACGAGGA CCACCTCACG TACCTCGACG CGGGCCGCAT CGCACGTGAT 
GCCGGCGTCG CCGCCGTCGC CCTCCACGGC CGCACCGCGG CGCAGTTCTA TTCCGGCCAG 
GCTGACTGGT CCGCCATCGC CCGGCTGCGA GAAGCGCTGC CGGACATTCC GGTCCTGGGC 
AACGGCGACA TCTGGTCCGC CGAGGATGCC GTGCGCATGG TCCGAGAGAC CGGCGTGGAC 
GGCGTGGTGG TGGGCCGCGG CTGCCAGGGC AGGCCCTGGC TGTTCGGGGA TCTCCAGGCG 
GCTTTCGAAG GCAGCGACAC CCGCCACAGG CCGAACCTGC GGCAAGTGGC GGAGGGCGTC 
TACCGGCACG CGGAACTGAT GGTGGAAACC TTCGGCGACG AAGGCAAGGC CCTGCGGGAA 
ATCCGCAAGC ACATGGCGTG GTACTTCAAG GGATACGTGG TGGGCGGGGA ACTGCGCACC 
AGGCTTGCCC TGGTCACCAG CCTTCAGGTG CTGCGCGATA CGCTGGCCGA GCTGGACCAG 
GATTCCCCGT ACCCGGGTGC GGACGCCGAA GGCCCCCGCG GCCGCGCCGG TTCGCCCAAG 
AGGCCGGCGT TGCCCAAGGA CTGGCTGGAA TCCCGGGCGC TGAACGCCGA ACAGTCCCAG 
GACATCTCCG CCGCGGAACT GGACGTGTCA GGTGGCTGA

Protein sequence

MTVVATPPAP KLELPPLKLG PLTVDTPVIL APMAGITNSA FRRLCREYGG GMYVAEMVTS 
RALVERTPES LRIISHDDDE KVRSVQLYGV DPVTVGQAVR MLVEEDRADH IDLNFGCPVP 
KVTRRGGGSA LPWKIDLFTS IVQTAVKEAS KGNVPLTIKM RKGIDEDHLT YLDAGRIARD 
AGVAAVALHG RTAAQFYSGQ ADWSAIARLR EALPDIPVLG NGDIWSAEDA VRMVRETGVD 
GVVVGRGCQG RPWLFGDLQA AFEGSDTRHR PNLRQVAEGV YRHAELMVET FGDEGKALRE 
IRKHMAWYFK GYVVGGELRT RLALVTSLQV LRDTLAELDQ DSPYPGADAE GPRGRAGSPK 
RPALPKDWLE SRALNAEQSQ DISAAELDVS GG