Gene Caul_3865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3865
Symbol
ID	5901327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4184783
End bp	4186306
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	65%
IMG OID	641564387
Product	nitrate reductase, beta subunit
Protein accession	YP_001685489
Protein GI	167647826
COG category	[C] Energy production and conversion
COG ID	[COG1140] Nitrate reductase beta subunit
TIGRFAM ID	[TIGR01660] nitrate reductase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTGC GCGCCCAAAT CGGCATGGTG CTGAACCTCG ACAAGTGCAT CGGGTGTCAC 
ACCTGCTCGG TCACCTGCAA GAACGTGTGG ACCAATCGCG AAGGCGTCGA ATACGCCTGG 
TTCAACAACG TCGAGACCAA GCCCGGCATC GGCTTTCCCA AGGACTGGGA GAACCAGAAG 
AAGTGGAACG GCGGCTGGAT CCGCAAGGCC AACGGCAAGA TCGAGCCGAA GATGGGCGCC 
AAATGGCGCA TCCTGGCCAA GATCTTCGCC AATCCCGACC TGCCCGAGAT CGACGACTAT 
TACGAGCCGT TCGACTTCGA CTACGCCCAC CTGCAGAACG CCCCGGAGAT GAAGAACTTC 
CCGACCGCGC GGCCGCGCTC GAAGATCACC GGCCAGCGGA TGGAGAAGAT CGAGTGGGGT 
CCCAACTGGG AGGAGATCCT GGGCGGCGAG TTCTCCAAGC GCTCGGCCGA CGCCAATTTC 
GAGGGCGTCG AGAAGGAGAT CTACGGCCAG TTCGAAAACA CCTTCATGAT GTATCTGCCG 
AGGCTGTGCG AGCACTGCCT CAACCCCACC TGCGTGGCCG CCTGCCCGTC GGGCGCGATC 
TACAAGCGCG AGGAGGACGG CATCGTCCTG ATCGACCAGG ACAAGTGCCG GGGCTGGCGG 
ATGTGCGTCT CGGCCTGTCC CTACAAGAAG ATCTACTACA ACTGGGAATC GGGAAAATCG 
GAGAAGTGCA CCTTCTGCTT CCCGCGCATC GAGGCGGGCC AGCCGACGGT GTGTTCGGAG 
ACCTGCGTGG GCCGCATCCG GTATCTGGGC GTGCTGCTCT ATGACGCCGA CCGCATCCAG 
GCCGCCGCCT CGACCCCCGA CGAGAAGGAC CTTTACCAGG CCCAGATCGA CATCTTCCTG 
GATCCCAACG ATCCGGCGGT GATCGCCCAG GCGCGCGCCG ACGGCGTTCC CGAGGCCTGG 
CTGGACGCGG CCCGCAAGAG CCCCGTCTAC AAGATGGCCA TCGACTGGAA GGTCGCCTTC 
CCGCTGCACC CCGAATACCG CACCCTGCCG ATGGTCTGGT ACGTGCCGCC GCTGTCGCCG 
ATCCAATCGG CCGCCTCGGC CGGGGCGCTG GAGATGGACG GCGACATGCC CGACGTCGCC 
TCGCTGCGTA TTCCGGTGCG CTATCTGGCC AACCTGCTGA CCGCCGGCAA CGAGCCGCCG 
GTGGTGCAGG CGCTAGAGCG GATGCTGGCC ATGCGCGGCT TCATGCGGGC CAAGACGGTG 
GATGGCCGCA TCGACCACGC CATCGCCGGC AAGGTCGGGC TGACCGCCGC GCAGATCGAG 
GACATGTACC GCTACATGGC CATCGCCAAC TACGAAGACC GCTTCGTCAT CCCCTCGGCC 
CACCGCGAAG TCGCCGAGGA CGCCTACGAC CTGCGCGGCT CCTGCGGCTT CACCTTCGGC 
AACGGCTGTT CGGGCGGCCG CACCGAACTG GGCCTGTTCG GCTCCAACCC GCGCTCGCGC 
GCCAAGACCC CGATGGAGGC CTAA

Protein sequence

MKVRAQIGMV LNLDKCIGCH TCSVTCKNVW TNREGVEYAW FNNVETKPGI GFPKDWENQK 
KWNGGWIRKA NGKIEPKMGA KWRILAKIFA NPDLPEIDDY YEPFDFDYAH LQNAPEMKNF 
PTARPRSKIT GQRMEKIEWG PNWEEILGGE FSKRSADANF EGVEKEIYGQ FENTFMMYLP 
RLCEHCLNPT CVAACPSGAI YKREEDGIVL IDQDKCRGWR MCVSACPYKK IYYNWESGKS 
EKCTFCFPRI EAGQPTVCSE TCVGRIRYLG VLLYDADRIQ AAASTPDEKD LYQAQIDIFL 
DPNDPAVIAQ ARADGVPEAW LDAARKSPVY KMAIDWKVAF PLHPEYRTLP MVWYVPPLSP 
IQSAASAGAL EMDGDMPDVA SLRIPVRYLA NLLTAGNEPP VVQALERMLA MRGFMRAKTV 
DGRIDHAIAG KVGLTAAQIE DMYRYMAIAN YEDRFVIPSA HREVAEDAYD LRGSCGFTFG 
NGCSGGRTEL GLFGSNPRSR AKTPMEA