Gene Sare_3139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3139
Symbol
ID	5706349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3572128
End bp	3573858
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	68%
IMG OID	641272571
Product	nitrate reductase, beta subunit
Protein accession	YP_001537938
Protein GI	159038685
COG category	[C] Energy production and conversion
COG ID	[COG1140] Nitrate reductase beta subunit
TIGRFAM ID	[TIGR01660] nitrate reductase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.250265
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00103191
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGGTGA TGGCGCAGAT GGCAATGGTG ATGAACCTCG ACAAGTGCAT CGGCTGTCAC 
ACCTGCTCGG TGACCTGCAA GCAGGCGTGG ACCAACCGAT CCGGGGTCGA GTACGTCTGG 
TTCAACAACG TGGAGACCCG CCCCGGTCAG GGCTACCCCC GTACCTACGA GGACCAGCAG 
CGGTGGCAGG GCGGGTGGGT GCGCACCCGG TCCGGGCGGC TCAAGCCCCG CTCGGGCGGA 
CGGCTGAAGA AGATGTTCAC CGTTTTCGCC AACCCGAAAC TGCCCTCCAT GCGGGACTAC 
TACGAGCCCT GGACGTACGA CTACGAGCAC CTGATCAGCG CGCCGTCCGG CGACGACATC 
CCGGTCGCCC GCCCGAAGTC CCTGATCACC GGCCAGGACA CGAAGATCAC CTGGAGTGCG 
AACTGGGACG ACTCCCTGGC CGGGGGTAAC GAGGTCACGG CGGGTGATCC GGTGTTGGCA 
AAGGTGTCCG AGCAGGTCCG GCAGGAGTAC GCGAAGACCT TCATGTTCTT CCTGCCCCGC 
ATCTGCGAAC ACTGCCTCAA TCCGTCCTGC GCCGCGTCCT GCCCCTCGGG CGCGATCTAC 
AAGCGCAGCG AGGACGGCAT CGTGCTGGTC GATCAGGACC GCTGCCGGGG CTGGCGGATG 
TGCATCACCG GATGCCCATA CAAGAAGGTG TACTTCAACC ACCGCACCGG CAAGGCGGAG 
AAGTGCACGT TCTGCTTTCC ACGTATCGAG ATCGGCCAGC CGACCATCTG CTCCGAAACG 
TGCGTCGGCC GACTGCGGTA CCTCGGCCTC ATGCTCTACG ACGGCGACAC GGTGGCCGAC 
GCCGCCGCCA CCGAAGCCGA ACAGGACCTC TACGCGGCGC AGCGCTCGGT GTTCCTTGAC 
CCCCACGACC CCGCCGTCGT GGCCGCCGCG CGGGCGGGCG GTATCCCCGA CGACTGGATC 
GACGCCGCGC AACAGTCCCC GATCTGGGAC CTGATCATGA AGTATGAGGT GGCGCTGCCG 
TTGCACCCGG AATATCGGAC CATGCCCATG GTCTGGTACA TCCCGCCCCT GTCCCCCGTG 
GTGGACGTGC TGCGCGACAC CGGTCACGAC GGCGAGCAGG CCGGCAACCT CTTCGGCGCG 
ATCGACGCCC TCCGTATCCC CGTCGACTAC CTCGCGGAAC TGTTCACCGC GGGCGACCCA 
CAACCCGTGC GGGCGGTACT CGACCGGCTC GCCGCCATGC GTGCCTACCA GCGCCGCATC 
AATCTTGGCG AGGCACCGGA CGAGACCATT CCCGCCGCGG TCGGCATGAC CAGCGACGAC 
ATGGACGACA TGTACCGTCT CCTGGCTGTC GCCAAATACG AGCAGCGCTA CGTCATCCCC 
GCCGCCCACG CCGAAGACGC CCACCGCCTC GAAAAGATCG CCACCGAGTG CGCCCTGGAC 
TACGAAGGCG GCCCCGGCAT GGGCGGCGGT GGACCCTACG GGCAGGGCCC CTTCGGGGAG 
TCCTCCGGCA CGCCCGTACC GATCCAGGTG GAGACCTTCG ACGCGCAGCG CAACCGGCAG 
CGAGCCGACC TCTTCATCGA CCAGGGCGAC GCGGCACAGC GGGCCCGGCT GCTCGACGTG 
GACAGCGAGG GCGACCGGAC CAACCTGGCC CACCCGAGGA AGGACCCGAC CGGCGAGGGC 
GGCGACTCCA CCGGCCCTGG CGTCATCGAC ATCAACCGGG ACCAGCCGTG A

Protein sequence

MRVMAQMAMV MNLDKCIGCH TCSVTCKQAW TNRSGVEYVW FNNVETRPGQ GYPRTYEDQQ 
RWQGGWVRTR SGRLKPRSGG RLKKMFTVFA NPKLPSMRDY YEPWTYDYEH LISAPSGDDI 
PVARPKSLIT GQDTKITWSA NWDDSLAGGN EVTAGDPVLA KVSEQVRQEY AKTFMFFLPR 
ICEHCLNPSC AASCPSGAIY KRSEDGIVLV DQDRCRGWRM CITGCPYKKV YFNHRTGKAE 
KCTFCFPRIE IGQPTICSET CVGRLRYLGL MLYDGDTVAD AAATEAEQDL YAAQRSVFLD 
PHDPAVVAAA RAGGIPDDWI DAAQQSPIWD LIMKYEVALP LHPEYRTMPM VWYIPPLSPV 
VDVLRDTGHD GEQAGNLFGA IDALRIPVDY LAELFTAGDP QPVRAVLDRL AAMRAYQRRI 
NLGEAPDETI PAAVGMTSDD MDDMYRLLAV AKYEQRYVIP AAHAEDAHRL EKIATECALD 
YEGGPGMGGG GPYGQGPFGE SSGTPVPIQV ETFDAQRNRQ RADLFIDQGD AAQRARLLDV 
DSEGDRTNLA HPRKDPTGEG GDSTGPGVID INRDQP