Gene Caul_4020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4020
Symbol
ID	5901482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	4354671
End bp	4356113
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	66%
IMG OID	641564541
Product	sugar transporter
Protein accession	YP_001685643
Protein GI	167647980
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00879] MFS transporter, sugar porter (SP) family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.997993
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCATCTG TATCCAACGC CGGGCCCAGC CCGGGGATGA GCGCCGACGG CGCGAAGGTC 
AACATGGCCT TCATCGCCGC CATCGTGGCC GTCGCCACCA TCGGCGGCTT CATGTTCGGC 
TACGACAGCG GCGTCATCAA CGGCACGCAG GAAGGCCTCG AGAGCGCCTT CAACCTCAGC 
AAGCTGGGCA CCGGCCTGAA CGTCGGCGCG ATCCTGATCG GCTGCGCGTT CGGCGCCTTC 
GCGGCCGGCC GCCTGGCCGA CGTCTGGGGC CGCCGCACGG TGATGATCAT CGCCGCCCTG 
CTGTTCCTGG TCAGCGCCAT CGGCTCGGGC GCCGCCCACA CCTCCATGGT GTTCATTTTC 
TTCCGCCTGA TCGGCGGCCT GGGCGTGGGC GCGGCCAGCG TGCTTTGCCC GGTCTACATC 
TCGGAAGTGA CGCCGGCCAA CATCCGCGGC CGGCTCTCAT CCGTGCAGCA GATCATGATC 
ATCACCGGCC TGACCGGCGC GTTCGTGGCC AACTACATCC TGGCCCACAC CGCCGGCAGC 
TCGACGGCGA TCTTCTGGAT GGGCTTCCCG GCCTGGCGTT GGATGTTCTG GATGCAGACG 
ATTCCCGCCG CGATCTTCTT CTTCAGCCTG CTGTCGATCC CGGAAAGCCC CCGCTACCTG 
GTGGCCAAGG GCAAGGACGC CGAGGCCTCG GCGATCCTCT CGCGCCTGTT CGGCCAGGGT 
GAGGGCGACA AGAAGGTGGC CGAGATCCGC GCCTCCCTGG CCGCCGACCA TCACAAGCCC 
AAGATGAGCG ACCTGATCGA CCCGATCACC AAGAAGCTGC GCCCGATCGT CTGGACCGGC 
ATCGGCCTGG CCGTCTTCCA GCAGTTGGTC GGCATCAACA TCGTCTTCTA CTACGGCTCG 
GTGCTGTGGC AGTCGGTGGG CTTCTCGGAA GACGACAGCC TGAAGATCAA CATCCTGTCG 
GGGTCGCTGT CGATCCTGGC CTGCCTGCTG GCCATCGCCC TGATCGACAA GATCGGTCGC 
AAGCCGCTGC TGCTGATCGG CTCGGCCGGC ATGGCCGTCA CCCTGGGCAC GGTGGGCTAC 
TGCTTCTTCC AAGGCTCGAT GGTCAACGGC GCGCTCAGCC TGCCGGGCAA TTTCGGCCTG 
ATCGCCCTGA TCGCCGCCAA CGCCTATGTG GTGTTCTTCA ACCTCTCATG GGGTCCGGTC 
ATGTGGGTCA TGCTGGGCGA GATGTTCCCC AACCAGATCC GCGGCTCGGG CCTGGCCGTC 
GCCGGCTTCG CCCAGTGGAT CGCCAACTTC GGCATCTCGG TCAGCTTCCC GGCCATGGCC 
GCGGGCCTGG GCCTGCCGGT CACCTACGGC TTCTATGCCC TGAGCGCCCT GATCTCGTTC 
TTCTTCGTCC AGAAGATGGT TCGCGAGACC CGTGGGCAAG AGCTGGAAGA CATGGTGGGG 
TAG

Protein sequence

MASVSNAGPS PGMSADGAKV NMAFIAAIVA VATIGGFMFG YDSGVINGTQ EGLESAFNLS 
KLGTGLNVGA ILIGCAFGAF AAGRLADVWG RRTVMIIAAL LFLVSAIGSG AAHTSMVFIF 
FRLIGGLGVG AASVLCPVYI SEVTPANIRG RLSSVQQIMI ITGLTGAFVA NYILAHTAGS 
STAIFWMGFP AWRWMFWMQT IPAAIFFFSL LSIPESPRYL VAKGKDAEAS AILSRLFGQG 
EGDKKVAEIR ASLAADHHKP KMSDLIDPIT KKLRPIVWTG IGLAVFQQLV GINIVFYYGS 
VLWQSVGFSE DDSLKINILS GSLSILACLL AIALIDKIGR KPLLLIGSAG MAVTLGTVGY 
CFFQGSMVNG ALSLPGNFGL IALIAANAYV VFFNLSWGPV MWVMLGEMFP NQIRGSGLAV 
AGFAQWIANF GISVSFPAMA AGLGLPVTYG FYALSALISF FFVQKMVRET RGQELEDMVG