Gene Caul_4612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4612
Symbol
ID	5902074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4988513
End bp	4989763
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	67%
IMG OID	641565131
Product	nucleoside:H symporter
Protein accession	YP_001686230
Protein GI	167648567
COG category
COG ID
TIGRFAM ID	[TIGR00889] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.913784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.258863
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGACGA GCTTCCGGCT CTTTCTGATG ATGGTGCTTC AGCTGGCCAT CTGGGGCGCC 
TGGGCGCCCA AGATCTTCCC CTACATGGGC ATGCTGGGCT TCGCGCCCTG GCAGCAGTCC 
CTGGTCGGCA GTTCCTGGGG CGTGGCCGCC CTGGTCGGCA TCTTCTTTTC CAACCAGTTC 
GCGGACCGCA ATTTCGCGGC CGAGCGCTTC CTGGCGGTCA GCCACCTGAT CGGCGGCCTG 
GCCCTGGTCG GGACGGCGTT CGCCACCAGC TTCTGGCCGT TCTTCGCCTG CTACCTGATC 
TTCAGCCTGG TCTATGTGCC GACCCTGTCG GTGACCAACT CCATCGCCTT CGCCAATCTG 
CGCGACCCCG CGGCCGACTT CGGCGCGGTG CGCATGGGCG GCACGGTGGG CTGGGTGCTG 
GTCAGCTGGC CCTTCGTGTT CCTGCTGGGC GCCCACGCCA CGGCCGAGCA GGTGCGGTGG 
ATCTTCCTGG TCGCGGCGGT CGTCTCGTTC GTCTTCGCCG GCTACGCCCT GACCCTGCCG 
CACACGCCGC CCCGCAAGGA CGCGCCCGGC ATCGACAAAC TGGCCTGGCG ACGCGCCTTC 
AAGCTGCTGG CCGCGCCGTT CGTGCTGGTG CTGTTTCTGG TCACCTTCAT CGATTCTGTG 
ATCCACAACG GCTATTTCGT GATGGCCGAC GCCTTCCTGA CCAACCGGGT CGGGATCGCC 
GGCAACCTCA GCATGGTGGT GCTGAGCCTG GGCCAGGTGG CCGAGATCCT GACCATGTTC 
CTGCTGGGCC GGGTGCTGGC GCGGCTGGGC TGGAAGATCA CCATGATCGT CGGCGTGCTG 
GGCCACGCCG CGCGCTTCGC GGTGTTCGCC TTCTTCGCCG ACAGCGTCCC GGTGATCGTG 
GCGGTGCAGC TGCTGCACGG GGTCTGCTAC GCCTTCTTCT TCGCCACGGT CTATATCTTC 
GTCGACGCGG TCTTCCCCAA GGACGTCCGC TCCAGCGCCC AGGGCCTGTT CAACCTGCTG 
ATCCTCGGCG TCGGCAATGT GGCGGCCAGC TTGCTGTTCC CGACCCTGAT CGGCCGCCTG 
AGCCACGCCG GGGCCGATGG CGCGGCCGTG GTCGACTATA CGAGCCTGTT CATGGTCCCG 
ACCGGCATGG CCCTGGCGGC GGTGCTGCTG CTGGCCCTGT TCTTCAAGCC GCCGACGCGC 
GGACCGGTGG TCGAGACAGA CGTCGTGTCC GCCAGCCCGG CCCAGGTCTG A

Protein sequence

MKTSFRLFLM MVLQLAIWGA WAPKIFPYMG MLGFAPWQQS LVGSSWGVAA LVGIFFSNQF 
ADRNFAAERF LAVSHLIGGL ALVGTAFATS FWPFFACYLI FSLVYVPTLS VTNSIAFANL 
RDPAADFGAV RMGGTVGWVL VSWPFVFLLG AHATAEQVRW IFLVAAVVSF VFAGYALTLP 
HTPPRKDAPG IDKLAWRRAF KLLAAPFVLV LFLVTFIDSV IHNGYFVMAD AFLTNRVGIA 
GNLSMVVLSL GQVAEILTMF LLGRVLARLG WKITMIVGVL GHAARFAVFA FFADSVPVIV 
AVQLLHGVCY AFFFATVYIF VDAVFPKDVR SSAQGLFNLL ILGVGNVAAS LLFPTLIGRL 
SHAGADGAAV VDYTSLFMVP TGMALAAVLL LALFFKPPTR GPVVETDVVS ASPAQV