Gene Caul_1250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1250
Symbol
ID	5898705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1311478
End bp	1312593
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	70%
IMG OID	641561735
Product	hypothetical protein
Protein accession	YP_001682878
Protein GI	167645215
COG category	[R] General function prediction only
COG ID	[COG0666] FOG: Ankyrin repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.41462
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0169121
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGAAGA ATATCCTAGC CATGTCGGCG GGTGTGGCCG CGCTGCTGCT TGTCGCGGCC 
CAACCCGCGT TCGCCGAGGC GGACCTCGCC AGGGCCGCCG CCGACCAGAA CATCAAGAAG 
ATCGACAAGC TTCTGGCCGC GGGCGCCGTC ATCGACGAGC CCGACAGCGA GGGTCGATCG 
GCCTTCTTCC ACGCCGCCGC GAAGGGTGAC CTGGGACTGA TGCAGAGGTT CGCCGACAAG 
GGCGCCAGCA TCGACCTGCG CGACAAGACG GGCGCGACCC CGCTGCTGGC CGCGCTGCGC 
AATCCGGCCA CCCAGGCGCC CACCGTGGAG TTCCTGCTCG CCAAGGGCGC CGAGATCAAC 
GCCGCCGACC AAGCCGGACG CACACCGCTG ATGGAAGCCG TGCTCCGCGC GCCCGAGGTC 
CTGGACACCG ACGGCCAGGT CGCCATGGTG GCCGCGCTGC TGAAGGCCGG CGCCGATCCC 
AACAAGGTCG ATCTCACGGG CGCCGCCGCG CTGCATCACG CGGCCTATGT GGGCGAACCG 
CGCAAGGTCC TCGAACTGCT GCTCGTCTCC ACCAAGGACA CCGGCGCGAC AACGGTTTCG 
GGCGCCAACG TGCTGATGAT GGCTGCCCAG AACCACCAGC GCGCCAATGC GGACTATCTG 
CTGGCGCGCG GCTTCCGCCC TGTCCGGATC AAGGCCGCCG CCAACGACAA GCCCGAGCTC 
GCCCAGGATA TGTCGCCTCG CGCCAACGCC CTGGCCGCCG ACTGGTGGGG TCTGTACGCG 
ACCCGCAAGG GCGACCAGGC CTCGGCCAAG GCCGCCTTCG CGACAGCGGC CGACGACTAC 
GACGCTGCGG CGGCCGAGGC TCGTCGCCTG ACCACCGCCT ACGAGGCCGA ACTGGTCAAG 
GACAAGCAGG CGCGCGCCGC CCATCGCGCC GCCGCCGGCG CGGCCACCGT GCTGACCACC 
GCCCTGACCC TCGGGGCCGG CTACGCCTTC ATCTACATTC CCGCCTTGGC GACCGAGGTC 
GAAGAGGACG AGCGGGCCAT CGCCACGTTC AAGGCCGAGA CGGCCGAATT CACCGCCAGA 
GCCGTCGCCT TGCGCGGCCA GCTCGCCGCA AATTGA

Protein sequence

MKKNILAMSA GVAALLLVAA QPAFAEADLA RAAADQNIKK IDKLLAAGAV IDEPDSEGRS 
AFFHAAAKGD LGLMQRFADK GASIDLRDKT GATPLLAALR NPATQAPTVE FLLAKGAEIN 
AADQAGRTPL MEAVLRAPEV LDTDGQVAMV AALLKAGADP NKVDLTGAAA LHHAAYVGEP 
RKVLELLLVS TKDTGATTVS GANVLMMAAQ NHQRANADYL LARGFRPVRI KAAANDKPEL 
AQDMSPRANA LAADWWGLYA TRKGDQASAK AAFATAADDY DAAAAEARRL TTAYEAELVK 
DKQARAAHRA AAGAATVLTT ALTLGAGYAF IYIPALATEV EEDERAIATF KAETAEFTAR 
AVALRGQLAA N