Gene Caul_3862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3862
Symbol
ID	5901324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4178267
End bp	4179628
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	68%
IMG OID	641564384
Product	major facilitator transporter
Protein accession	YP_001685486
Protein GI	167647823
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACGG CGACGCCATC GCAACCGGGA GCCGGATCGG CCCTGACGAT GAGCACGATC 
GCCTTCACCG CCTGTTTCGC GGTGTGGACG GTGTTTTCGA TCATCGGCGT CAAGATCAAG 
CAGGACCTGG GACTGAGCGA GGCCCAGTTT GGCCTGCTGG TCGGCACCCC GATCCTGACC 
GGCTCGCTGG TGCGGGTGTT CCTGGGCGTG TGGACCGACC AATATGGCGG CCGCCTGGTC 
AATCTGCTGG TCATGCTGTC GGCGGCGGCG GCCACCTTCC TGCTCTCCTA CGCCCACACC 
TATCCGCAGT TCCTGGTGGC GGCGCTCGGC GTTGGCCTGG CCGGAGGCTC GTTCGCGGTC 
GGCGTGGCCT ATGTCTCCAA GTTCTTCCCC AAGGAACGCC AGGGCGCGGC GCTGGGCGTG 
TTCGGGGCCG GCAATGTCGG CGCCGCCGTG ACCAAGTTCG CCGCTCCCTT CGTGATGCTG 
GCCCTCGGCT GGCAGAGCGT GGCCCAGATC TGGGCCGGGG TGCTGGCCGT GCTGGCTCTG 
GCCTTCTTCT TCACCACCCG CGACGAGCCG GACCTGCAGG CGCGCCGCCG CACCGGCGCC 
AAGCCGCAGA ACACCGCCGC CCAGCTGGCG CCGTTGCGCA AGCTGCAGGT CTGGCGCTTC 
GCCCTCTACT ACTTCTTCGT GTTCGGCGGC TTCGTGGCCC TGTCGCTGTG GCTGCCGCAC 
TATCTGGTCG CGGTCTATCA TCTCAACATC ATCGCCGCGG GCATGCTGGC GGCCGCCTAT 
TCCATTCCCG GCTCGCTGTT TCGCATCGTC GGCGGCTGGC TGTCGGACAA GATCGGCGCG 
CGCAAGGTCA TGTACCTGAC CTTCGGCGTC AGCGCGGTCT GCGCCTTCCT GCTGTCCTAT 
CCGGCCACCA GCTACGTGGT CGACGGGGTG CGCGGCCCGA TCGCCTTTCG CCTGGCCACC 
GGGCTGGTCC CGTTCGTGAT CCTGCTGTTC ACCCTGGGCT TCGCCATGAG CCTGGGCAAG 
GCGGCCGTCT TCAAGCACAT CCCGGTCTAC TACCCCGATC ACATCGGTTC GGTCGGCGGC 
CTGGTCGGCA TGGTCGGCGG CCTGGGCGGC TTCGTGATGC CGATCGCCTT TGGCGCCCTC 
AACGACCTCA CCGGCGTCTG GACCAGCTGC TTCATGCTGC TGTTCGTCCT GGTCGCCGGA 
GCCCTGACCT GGATGCACCT GGCCATCGGC CGCATGGAGC GCGCCAACGC GCCCCAGCTG 
GCCAACCTGC CGCAGCTTCC TGAAATGGCC AGCCTTGGCA CGGCCGCCCC GACCCACGCC 
GCGCCCGCCG GGCGCGCCGC CATCCAACCC GCCAACTCAT GA

Protein sequence

MQTATPSQPG AGSALTMSTI AFTACFAVWT VFSIIGVKIK QDLGLSEAQF GLLVGTPILT 
GSLVRVFLGV WTDQYGGRLV NLLVMLSAAA ATFLLSYAHT YPQFLVAALG VGLAGGSFAV 
GVAYVSKFFP KERQGAALGV FGAGNVGAAV TKFAAPFVML ALGWQSVAQI WAGVLAVLAL 
AFFFTTRDEP DLQARRRTGA KPQNTAAQLA PLRKLQVWRF ALYYFFVFGG FVALSLWLPH 
YLVAVYHLNI IAAGMLAAAY SIPGSLFRIV GGWLSDKIGA RKVMYLTFGV SAVCAFLLSY 
PATSYVVDGV RGPIAFRLAT GLVPFVILLF TLGFAMSLGK AAVFKHIPVY YPDHIGSVGG 
LVGMVGGLGG FVMPIAFGAL NDLTGVWTSC FMLLFVLVAG ALTWMHLAIG RMERANAPQL 
ANLPQLPEMA SLGTAAPTHA APAGRAAIQP ANS