Gene Caul_3142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3142
Symbol
ID	5900597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3406346
End bp	3407506
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	68%
IMG OID	641563645
Product	hypothetical protein
Protein accession	YP_001684767
Protein GI	167647104
COG category	[S] Function unknown
COG ID	[COG3146] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0531471
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAGCCG TCAAGGCGGA GGTGCGCGTC CATCGGCGCA TCGCCGAGAT CGGGCGCGAC 
GCCTGGGACG CCTGCGCCGC GCCGTCGGGC GATCCGTTCG TCAGCTACGA TTTCCTCGAT 
GCGCTGGAAG AGAGCGGTTG CGCCGTCGAA CGCACCGGCT GGGCGCCGCA GCATCTTTCC 
GTCCAGGACG AGACCGGCCG CGTGGCGGCG GTCATGCCGC TTTATTTGAA GTCCCACAGC 
CAGGGCGAAT ACGTCTTCGA CCACAGCTGG GCCGACGCCT ACGAGCGAGC CGGCGGACGC 
TACTATCCCA AGCTCCAGTG CTCGGCGCCG TTCTCGCCGG TCACGGGGCC CCGGCTGATC 
GTGCGGCCCG ATATCGACAT CGACGACGGT CGCTCGGCCT TGCTTGGCGG GGCGCTGACC 
CTGTGCGACC GGCTGAACGC CTCGTCGCTG CACGTGACCT TTCCGAAGGC CGACGAGTGG 
GAATGGATGG GCGAGCGGGG CATGCTGCTT CGCCAGGACC AGCAGTATCA CTGGTTCAAC 
AACGGCTACG CGACCTTCGA CGACTTCCTG GCGGCCCTGT CGTCCAACCG CCGCAAGACC 
ATCCGCCGCG AGCGTCGGGA CGCCCAGGCG GGCCTCGAGA TCGTCGCCCT GACCGGCGCC 
GAGCTCACCG AGGACCACTG GGATGCTTTC TTCGGCTTCT ACATGGACAC CGGCGGTCGC 
AAATGGGGGC GGCCCTATCT GAACCGGGCG TTCTATTCGC TGCTGGGCGA GCGGATGGCC 
GAAAAGGTGT TGCTGATCCT GGCCCGCCGT CCAGGCGGTC CGTGGATCGC CGGGGCGCTG 
AACCTGATCG GCGGCGATTG CCTCTATGGC CGCCACTGGG GCTGCACCGA GGACGTGCCG 
TTCCTGCACT TCGAGCTCTG CTACTATCAG GCGATCGAGC ACGGCATCCG CCTGGGCCTG 
CCGCGGGTCG AGGCGGGCGC CCAGGGGCAG CACAAGATCG CTCGCGGCTA TCTGCCCAGC 
CCGGTCTATT CGGCCCACTG GATCGCCGAT CCGGCCCTGC GCGAGCCGGT GGCCCGCTAT 
CTGGAGCGTG AGCGCGAAGC GGTCAGCGCC GAGATCGAAA TGCTGACCGA GGAATTCTCG 
CCGTTTCGGC ACGAGGGGTA G

Protein sequence

MTAVKAEVRV HRRIAEIGRD AWDACAAPSG DPFVSYDFLD ALEESGCAVE RTGWAPQHLS 
VQDETGRVAA VMPLYLKSHS QGEYVFDHSW ADAYERAGGR YYPKLQCSAP FSPVTGPRLI 
VRPDIDIDDG RSALLGGALT LCDRLNASSL HVTFPKADEW EWMGERGMLL RQDQQYHWFN 
NGYATFDDFL AALSSNRRKT IRRERRDAQA GLEIVALTGA ELTEDHWDAF FGFYMDTGGR 
KWGRPYLNRA FYSLLGERMA EKVLLILARR PGGPWIAGAL NLIGGDCLYG RHWGCTEDVP 
FLHFELCYYQ AIEHGIRLGL PRVEAGAQGQ HKIARGYLPS PVYSAHWIAD PALREPVARY 
LEREREAVSA EIEMLTEEFS PFRHEG