Gene Caul_2958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2958
Symbol
ID	5900413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3212569
End bp	3213717
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	72%
IMG OID	641563455
Product	nitrate transporter
Protein accession	YP_001684583
Protein GI	167646920
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.899389
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGGC TGGCCGACCT GACCCTGGGC TTCATCCCGC TGACCGATTG CGCGCCGCTG 
GTCGTGGCCA AGGCCCAGGG CTTCTTCGCC GAGGAGGGGC TGGAGGTCGC GCTGAGCCGC 
GAGGCCTCGT GGGCGACGAT CCGCGACAAG GTCGCCGTGG GCGCGCTGGA CGGCGCCCAC 
ATGCTGGCGC CGATGGCTCT GGCCGCCGGC CTGGGGGAAG GCCTGGCCGC CGCGCCGATG 
CTGGCCCCCT TGGCGCTGAA CCAGAACGGC AGCGCGATCA CCGTCTCCAC CAGGCTGGCG 
GGGAAGCTGC GTGAGATCGA TCCCGAGGCC ATGGCCACGC CGCTGACCAC CGCCCAGGCC 
CTGGCCCGGT TCGTGGAGCG GCGTCGAGAC CAGGGCGCGC CGCTGCTGAC CTTCGCGGTC 
GTCTTCCCGC AGTCGATGCA CAACTACGCC TTGCGCTATT GGTTGGCGCA GGCGGGAATC 
GACCCTGACC GGGATGTGCG CCTGGTGGTC ACGCCGCCAC CTCGGATGGT CGAGCACCTG 
CGTTCCGGCG ACATCGACGG CTTCTGTGTG GGCGCGCCCT GGAACGCCGT CGCCATGGAC 
GAGGGCCTGG GCGAGGTGCT GATCAAGGCC TCGCAGTTCT GGCCCGGCGG CCCGGACAAG 
GTGTTCGGCC TCACCGCCGT CTGGGCCGAG CGGCATCCTG ACGAACTTCG GGCGGCCTTG 
CGCGCCTTGA TCCGGGCTTC GGCCTGGACC GACGAGGCGG GCAACCATGC GGAGCTTGTG 
GCCCTGCTGT CACGGGCCGA CCACGTCGGC GTCGAGCCCG AAGCCCTGGC CCGCGCGCTG 
AAAACGGAGA TCGTCTTCCA TCGCGACGCC GCCGGCCTGC CGCGCCGCGA GCACGCCCTG 
TGGTTCCTGT CGCAGATGGT TCGCTGGGGG CAGGTGGGGC GGGACGTCGA TCTCGACGCC 
GTCGCCGACC GCGTCTATCG CCCGGACCTG TTTCGCGAGG CGGCGCTGTC GCTGGGGCCG 
GTGTTCGAGC CAGCCATGGT GTTCGCCGAC GCCGCGCCCG CGCCGTCAGC CTTGTTCGAT 
GGCAAGCCGT TCGATCCGGC GGACGCGCGG GGCTATGCGG CGTCGTTCGC GATCGGGCGC 
GGTTCCTGA

Protein sequence

MSGLADLTLG FIPLTDCAPL VVAKAQGFFA EEGLEVALSR EASWATIRDK VAVGALDGAH 
MLAPMALAAG LGEGLAAAPM LAPLALNQNG SAITVSTRLA GKLREIDPEA MATPLTTAQA 
LARFVERRRD QGAPLLTFAV VFPQSMHNYA LRYWLAQAGI DPDRDVRLVV TPPPRMVEHL 
RSGDIDGFCV GAPWNAVAMD EGLGEVLIKA SQFWPGGPDK VFGLTAVWAE RHPDELRAAL 
RALIRASAWT DEAGNHAELV ALLSRADHVG VEPEALARAL KTEIVFHRDA AGLPRREHAL 
WFLSQMVRWG QVGRDVDLDA VADRVYRPDL FREAALSLGP VFEPAMVFAD AAPAPSALFD 
GKPFDPADAR GYAASFAIGR GS