Gene Caul_0483 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0483
Symbol
ID	5897938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	523584
End bp	524753
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	67%
IMG OID	641560966
Product	DNA binding domain-containing protein
Protein accession	YP_001682115
Protein GI	167644452
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01764] DNA binding domain, excisionase family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGACG ACACGTTTTT CATGTCTGCA GACGAGGCCG CCCAGACGCT GGGCGTCAGC 
TTGACGACGC TCTATGCCTA TGTGAGCCGC AAAGGCATCC GGTCCGAAAA ACAGCCCGGG 
TCGAAGAGCC GTCGGTACTG GCGGGCGGAC GTGGAGATCG CGCGCACGCG TGGCAAGCCG 
GCCGATCCAT CGGCGGGCCT GATCAGATCG ACCGCCGTCA CGCTGATGAC TGGGCAGGGG 
CCGTTCTATC GCGGCGTCTC GGCGATCGCG CTGTCGCAGA CGGCGAGCAT CGAAGAGGTT 
GCAAGCCTCC TATGGGACGC GCCCGACGCC TTTGCCGATA CGACACCAAC CTTGCCGTCG 
GACTATGACG ACGCCGCGCG GGTCATGTCG TCCCTGCCCA GGACGGCGCG CGCCATCGCC 
CTGTTTGGCT TGATGGAGCA GGCCAATCCT CGCGCGCACG ACCTTTCTCC CAGTGGATAC 
GCGCGCACCG GGGCGGGCGT CATTCGATGC TTCGCCGCGA TCGTCGGCGG CGGCTCCCCG 
ACAGAGGTCG CGCCCATCCA TGAGAGTCTG GCGCGAAGTC TCAATGCGCC GCCGGGCTAC 
GCGGACGCCA TTCGAAGCTG CCTGGTGCTT GCCGCCGATC ACGAACTGGA TCCGACGACG 
TACGCCGTCC GCGCCGCGGC CAACACGGGC GTGACACCCT ATGGCGCGGC CATGGCGGGC 
TTGATCGCCG GGCGCGGCCG CCGGCTGAAG CTTGCGCGCG CCGAGCGTGT CGCCCGGTTC 
GTCGACGAGC TGATGACGGG CGATCCGAGA GAGGCCGTCG TCTCGCGCTT TCGGATCGGC 
GAAGCGCTCC CTGGTTTCGG CGGTGAGCTC TATGCCGATA CCGATCCCCG GGCCCAGGCC 
CTGATCTCGG CGCTTCGGGC CAGCGTTCCT GGCGAGCTCA TGGAGCGTCT GGACAAGGTT 
ATTGAGGTCG CGGCGGACCT GACCGGCGCC GGCCCGGATT TCATTCTGCC AACGGTGTTT 
CTGGGCAGGC TACTGGGCTT GAAGGGTGAG GAACTGGCGG TCTCGACCGT GGGAAGAATG 
GTCGGGTGGA TCGCCCACGC CATGGAGCAA TACCAGGACA ACGACCTCTT CCGGCCGCGC 
GCGGCCTATG CTGGCAAGTT ACCGAACTGA

Protein sequence

MNDDTFFMSA DEAAQTLGVS LTTLYAYVSR KGIRSEKQPG SKSRRYWRAD VEIARTRGKP 
ADPSAGLIRS TAVTLMTGQG PFYRGVSAIA LSQTASIEEV ASLLWDAPDA FADTTPTLPS 
DYDDAARVMS SLPRTARAIA LFGLMEQANP RAHDLSPSGY ARTGAGVIRC FAAIVGGGSP 
TEVAPIHESL ARSLNAPPGY ADAIRSCLVL AADHELDPTT YAVRAAANTG VTPYGAAMAG 
LIAGRGRRLK LARAERVARF VDELMTGDPR EAVVSRFRIG EALPGFGGEL YADTDPRAQA 
LISALRASVP GELMERLDKV IEVAADLTGA GPDFILPTVF LGRLLGLKGE ELAVSTVGRM 
VGWIAHAMEQ YQDNDLFRPR AAYAGKLPN