Gene Nmul_A0686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0686
Symbol	rbcL
ID	3784063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	787189
End bp	788658
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	57%
IMG OID	637810768
Product	ribulose bisophosphate carboxylase
Protein accession	YP_411385
Protein GI	82701819
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.153221
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAG CAATTACCGG CGCCGAGCGA TACAAATCTG GCGTAATTCC CTACAAGAAA 
ATGGGTTACT GGGAACCTGA CTATGTACCC AAGGATACCG ACATTATCGC CATGTTCCGT 
ATCACCCCCC AGGCAGGAGT GGAGCCTGAG GAAGCCGCAG CGGCGGTAGC CGGTGAATCT 
TCCACCGCGA CCTGGACCGT TGTGTGGACC GATCGGCTGA CCGCGTGCGA ACTGTATCGC 
GCGAAAGCTT TCCGTACCGA TCCCGTGCCC AATACTGGCG AAGGCACCAA GACTGAACAG 
CAGTATTTCG CCTACATCGC CTATGATCTT GATTTGTTCG AGCCGGGTTC CATCGCCAAC 
CTGACCGCCT CCATCATCGG CAACGTGTTC GGCTTCAAGG CTGTGAAAGC TTTGCGTCTG 
GAAGACATGC GTATCCCGGT GGCTTATCTG AAGACTTTTC AGGGTCCCGC AACCGGTATC 
ATCGTGGAGC GCGAGCGTCT CGATAAATTT GGCAGGCCGC TGCTGGGCGC GACGACCAAG 
CCGAAACTGG GGCTTTCCGG CCGCAACTAT GGCCGCGTGG TATACGAAGG ACTCAAGGGT 
GGTCTCGACT TCATGAAAGA TGACGAGAAC ATCAACTCGC AACCCTTCAT GCACTGGCGT 
GACCGCTTCC TGTACTGTAT GGAAGCAGTC AACAAGGCTT CAGCCGCTAC CGGCGAAGTC 
AAGGGCCACT ACCTGAACGT TACCGCCGGC ACCATGGAAG AGATGTACGA GCGCGCGGAA 
TTCGCCAAGT CGCTCGGCTC CGTCATCATC ATGATCGACC TGGTGATCGG CTATACCGCC 
ATTCAATCGA TGGCGAAGTG GGCGCGCAAG AACGACATGA TTCTGCACCT GCACCGTGCC 
GGCAACTCCA CCTACTCGCG CCAGAAGAAC CATGGCATGA ACTTCCGTGT CATCTGCAAG 
TGGATGCGGA TGGCGGGTGT AGACCATATC CATGCAGGCA CTGTCGTGGG CAAACTGGAA 
GGCGATCCCC TCATGATCAA GGGCTTCTAC GACACCCTGC GCGACCGTCA CACACCGGTA 
AGCCTGGAGC ACGGACTGTT CTTCGAGCAG GATTGGGCTT CGCTGAACAA GGTCATGCCG 
GTTGCTTCGG GCGGTATCCA TGCTGGCCAG ATGCACCAGT TGCTGGATTA CCTCGGCGAA 
GACGTGATAC TGCAGTTTGG CGGTGGCACC ATCGGACACC CGCAAGGCAT TCAGGCGGGC 
GCGGTCGCCA ACCGGGTCGC GCTGGAGGCA ATGATCATGG CGCGCAACGA AGGGCGCGAC 
TATGTGAAGG AAGGTCCTCA GATTCTGGAA GAAGCCGCCA AGTGGTGCAC CCCGCTCAAG 
CTGGCGCTGG ATACATGGAA GGACATCACC TTCAACTATG AATCCACCGA CACCGCCGAC 
TTTGTGCCGA GCGAAACAGC CAGCGTTTAA

Protein sequence

MSEAITGAER YKSGVIPYKK MGYWEPDYVP KDTDIIAMFR ITPQAGVEPE EAAAAVAGES 
STATWTVVWT DRLTACELYR AKAFRTDPVP NTGEGTKTEQ QYFAYIAYDL DLFEPGSIAN 
LTASIIGNVF GFKAVKALRL EDMRIPVAYL KTFQGPATGI IVERERLDKF GRPLLGATTK 
PKLGLSGRNY GRVVYEGLKG GLDFMKDDEN INSQPFMHWR DRFLYCMEAV NKASAATGEV 
KGHYLNVTAG TMEEMYERAE FAKSLGSVII MIDLVIGYTA IQSMAKWARK NDMILHLHRA 
GNSTYSRQKN HGMNFRVICK WMRMAGVDHI HAGTVVGKLE GDPLMIKGFY DTLRDRHTPV 
SLEHGLFFEQ DWASLNKVMP VASGGIHAGQ MHQLLDYLGE DVILQFGGGT IGHPQGIQAG 
AVANRVALEA MIMARNEGRD YVKEGPQILE EAAKWCTPLK LALDTWKDIT FNYESTDTAD 
FVPSETASV