Gene Caul_3564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3564
Symbol
ID	5901019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	3848929
End bp	3850044
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	69%
IMG OID	641564072
Product	hypothetical protein
Protein accession	YP_001685189
Protein GI	167647526
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0767] ABC-type transport system involved in resistance to organic solvents, permease component
TIGRFAM ID	[TIGR00056] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.777285
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCAC CGGCTGACTT CACCTTCGAG GATCATGAGG GCCGCAAGAC CGTCATGCTC 
TCGGGGGACT GGACCGCCCG CGGCATGGTC GATGCCGGGG AGCGCCTGAT CACGGCCCTG 
GACGGCTCGG ACGCCGTCGA TCTGGACCTG CGCGACCTCA GCCGCTGCGA CACCGCCGGC 
GCCTACGCCA TCATCCGCGC CGCCGACGGC CGGGTCAGCG CCGGCCACAT CAAGGCCAAC 
AGCCGAACCC TGCGCCTGCT GCAACTGGTC GGCGACGCCA TCCAGGTCGA GCCCGAGGCC 
GCGCCGCCGC AGAAGGGCTT CCAGGCCCTG CTGGAGCGTA TCGGCCGCGG CGTCTACGGG 
CTGGGCGACG ACCTCTACGG CACCCTGGGG TTTCTGGGGC ACCTGCTGGT GGCCATCGGC 
CGCTGCATCG CCAAGCCCAG CCGCATCCGC TGGGCGCCGG TGGTCGCGCT GGCCGAGCGG 
TCGGGGCTGG ACGCCATCCC GATCGTGGCC GTGACCACCT TCTTCATCGG CGCGGTCGTG 
GCCCTGCTGG GCGCCAACCT GCTGACCCAG TTCGGGGCCC AGGTGTTCGC CGTCGAACTG 
ATCGGCATCT CGGTGCTGCG GGAGTTCAAC ATCCTGATCA CCGCCATCCT GCTGGCCGGC 
CGCTCGGCCT CCAGCTTCGC GGCCGAGATC GGCTCGATGA AGATGAACCA GGAAATCGAC 
GCCATGCAGG TGATGGGGGT CGATCCCTAC GAAGCCCTGG TCCTGCCGCG CTTCGCCGCC 
CTGCTGATCA CCATTCCCCT GTTGACCTTC ATCGCCACCC TGGCGGGCCT GGCGGGCGGC 
ATGCTGGTCA CCTGGGCGGT GCTCGACCTG TCGCCGACCT TCTTCCTGCA GCGGATGCAG 
GACTCCGTCG GCGTGCAGCA CTACTGGATC GGCCTGTCGA AGGCCCCGGT GATGGCCATG 
GTCATCGCCG CCATCGGCTG CCGCCAGGGC ATGGAGGTCG GCAACGACGT CGAATCCCTG 
GGCCGCCGCG TCACCGCCGC CGTGGTCCAC GCCATCTTCG CGATCATCGC CATCGATGCG 
GTCTTCGCCC TGATCTACAT GGAGCTGGAC CTGTGA

Protein sequence

MGAPADFTFE DHEGRKTVML SGDWTARGMV DAGERLITAL DGSDAVDLDL RDLSRCDTAG 
AYAIIRAADG RVSAGHIKAN SRTLRLLQLV GDAIQVEPEA APPQKGFQAL LERIGRGVYG 
LGDDLYGTLG FLGHLLVAIG RCIAKPSRIR WAPVVALAER SGLDAIPIVA VTTFFIGAVV 
ALLGANLLTQ FGAQVFAVEL IGISVLREFN ILITAILLAG RSASSFAAEI GSMKMNQEID 
AMQVMGVDPY EALVLPRFAA LLITIPLLTF IATLAGLAGG MLVTWAVLDL SPTFFLQRMQ 
DSVGVQHYWI GLSKAPVMAM VIAAIGCRQG MEVGNDVESL GRRVTAAVVH AIFAIIAIDA 
VFALIYMELD L