Gene Caul_2198 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2198
Symbol
ID	5899653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2390305
End bp	2391828
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	66%
IMG OID	641562690
Product	hypothetical protein
Protein accession	YP_001683824
Protein GI	167646161
COG category	[S] Function unknown
COG ID	[COG2308] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.738171
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.508584
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACACGG GCGTGGCGGT GAAAATCAAG GACATCGACG ATACTCCCAG CCTGCCGATG 
ACCGGGGCGG CCTACCTACC AGGCGTCGCC TATGACGAGA TGATCGCCAG GGGCGGCGAC 
GTGCGGACCC ACTACGCGGC GTTGCAAAGC CGGATCTCCA CGCTGGGGGC CGGCGAGCTG 
GCCGACCGCC AGCGCATGCT CGAACGGTCC TTCCTGCTGC AGGGCATCAC CTTCACGGTC 
TACGGCGCCG ACAGCGCCAC GGAACGGATC ATCCCGACCG ACCTGTTCCC CCGCATCCTG 
CCGGCCCAGG AGTGGGCCAA GATCGAGGCC GGTCTCATCC AGCGTCTGCA GGCGCTGAAC 
ATGTTCCTGG CCGACATCTA TGGCGAGCAA CAGATCCTGA TGGACGGGGT CGTGCCGCGC 
GAACTGGTGC TGGGCGCGCC CTCCTACCGG CGCGAGATGC AGAACGTCTA CGTACCGCAC 
AAGTCCTACG CCAACGTCTG CGGCAGCGAC CTGATCCGGG GGCAGGACGG CGAGTTCGCC 
GTGCTGGAGG ACAATCTGCG GGTGCCGTCC GGCGTCTCCT ACATGCTGGC CAATCGCGAC 
GCCTCCAAGC GCACCTTCCC GGGCGCCTAT CGCGAGGCCG GCGTGCGACC GGTCGAGCGC 
TATCCCGACT TGCTGCTGGC GACGCTCAAG AGCATGAGCG CCGACTGGCG GTCCGATCCT 
CAGGTCGTGG TGCTGACCCC CGGGGTCTAT AATTCGGCCT ATTACGAGCA CGCCTATCTG 
GCGCGACTGA TGGGCGTGCC GCTGGTCGAG GGTCGCGATC TCGTGGTCCA TGACAACATG 
GTCTACATGC GCACCACCAC CGGCCTGCGC CGGGTGGACG TGATCTACCG CCGGGTCGAC 
GACGACTTCA TCGACCCCCT CGCCTTCCGC CGCGATTCGT CGCTGGGTGC CGCGGGTCTC 
TTCAACGCCT ACCGGGCCGG CAATGTTGTC ATCTGCAACG CGCCGGGCAC CGGGGTCGCC 
GACGACAAGG CGGTCTACGC CTTCGTGCCC GACATCATCC GCTACTATCT GGGCGAGGAC 
GCCATCCTGC CCAATATCGA GACCTTCCTG TGCCGCGAAC CGGCGCAGTT GAGCCATGTG 
CTGGCCAATC TCGACAAGTT GGTGGTCAAG GCCGTGGGCG CGTCCGGCGG CTACGGCATG 
CTGATTGGGC CGCACGCCTC GGCCAAAGAG CGATCCGAGT TCGCCGACGC CCTGACGGCC 
GATCCCGCCA ACTATATCGC CCAGCCGACC ATCCAACTAT CGACCGCCCC GTGCCTGGTC 
GATGGCCGGA TAGAGCCGCG GCACGTCGAC CTGCGGCCGT TCATCCTGTC GGGCGAGAAG 
ACCGTTGTCA CACCTGGCGC CCTGACCCGC GTAGCCCTGA AACGCGGCTC CCTGGTGGTC 
AATTCCAGCC AAGGCGGAGG CTCGAAGGAC ACCTGGGTGC TCTCCGAAGA GTCGCCGTCG 
AACGGTGCGG GAGGACTGGC ATGA

Protein sequence

MDTGVAVKIK DIDDTPSLPM TGAAYLPGVA YDEMIARGGD VRTHYAALQS RISTLGAGEL 
ADRQRMLERS FLLQGITFTV YGADSATERI IPTDLFPRIL PAQEWAKIEA GLIQRLQALN 
MFLADIYGEQ QILMDGVVPR ELVLGAPSYR REMQNVYVPH KSYANVCGSD LIRGQDGEFA 
VLEDNLRVPS GVSYMLANRD ASKRTFPGAY REAGVRPVER YPDLLLATLK SMSADWRSDP 
QVVVLTPGVY NSAYYEHAYL ARLMGVPLVE GRDLVVHDNM VYMRTTTGLR RVDVIYRRVD 
DDFIDPLAFR RDSSLGAAGL FNAYRAGNVV ICNAPGTGVA DDKAVYAFVP DIIRYYLGED 
AILPNIETFL CREPAQLSHV LANLDKLVVK AVGASGGYGM LIGPHASAKE RSEFADALTA 
DPANYIAQPT IQLSTAPCLV DGRIEPRHVD LRPFILSGEK TVVTPGALTR VALKRGSLVV 
NSSQGGGSKD TWVLSEESPS NGAGGLA