Gene Caul_0478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0478
Symbol
ID	5897933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	518674
End bp	519879
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	67%
IMG OID	641560961
Product	hypothetical protein
Protein accession	YP_001682110
Protein GI	167644447
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCGGT TTCAATCCGG ACACGCCCGC GCCGCCGATC CGTCTGTCGC CGGGGGCTAC 
AAGGTCGACA TCTCGCGCGG GGAGCGCATC GGCCGCGTCT CGTCGGAATG GTTCTCTCGA 
CCCGACGACG AGCGCTACCT TTCGCTCGGC GCGCTCTACG CCGCTGTTCA CGCCCGCGCC 
GAGCACGCCA CCTCCCGCAC GGTCGAGACC CGCCGTCTCC GTGTCGAGGC CGATCGCGAC 
GGCGCCGCGC GCCTGGCCCT GATCATGCCG GGTCGTGACG AGCCCGTCGC CCCGACTCAC 
TGGTCCTTCG GCCAGTTGTG CGGTCTGGTT GGCGCGCCGG CTGGCTACCT TCGCGATCTG 
CCCGCCCCCT TGGCCGGCAT CAACCTGCAG CACGGCTTGC TCTCGCATCG CGCTGAACTG 
ATCAAGACCC TTGAGACCGA CGACGGCCGC GTCGAACTGC GCGCCGTCAC CGGTCCCGAC 
TATGGGCGGA TCTGGGACCA TGAACTGGTC GCGGCGGTGA TGAAGATCGC CGGCGACGGC 
ACCGGCGACA CGCGCTGGAA GGTGCCCGGC CTGCTGGACT GGTCGATGAT GACCCACAAT 
CCGTTCGTCG AGGTCACCAA GGACACCACC ACCCTCTATG CCAGCGATCG CGACGTCTTC 
CTGTTCCTGG TCGATGACGC CCACCCGATC GAGGCGGGCC GCCTGCCGAA CGGCGAGCCA 
GATCTTTATT TCCGCGGCTT TTATTGCTGG AATAGCGAGG TCGGCTCCAA GACCCTGGGC 
ATGGCCTCCT TCTATCTCCG CGCTGTCTGC ATGAACCGCA ACATCTGGGG CGCCGAGGGC 
TTCCAGGAGA TCAGCATCCG CCACAGCAAG TTCGCCGCCC GGCGCTTCGT TCACGAGGCC 
GCGCCGGCGC TGGAGCGCTT CGCCAACGCC TCGACCACAC CCTTCATCAA CGGAATACGC 
GCCGCGCGCG AGACCATCGT CGCCCGCAAG GACGACGATC GCGAGACTTT CCTGCGCAAG 
CGCGGCTTCT CAAAGACCGA GACCGGCAGG ATCATCGCCA CGGTTCTGAA CGAGGAGGGT 
CGGCCCCCGG AATCGATCTT CGATTTTGTG CAAGGCATCA CGGCGGTCGC CCGGGACAAG 
CCCCAGCAGG ATGCCCGTCT GGAGCTGGAG GCAAAGGCCG GCCGATTGCT GGCCAGCGTC 
CGCTAG

Protein sequence

MMRFQSGHAR AADPSVAGGY KVDISRGERI GRVSSEWFSR PDDERYLSLG ALYAAVHARA 
EHATSRTVET RRLRVEADRD GAARLALIMP GRDEPVAPTH WSFGQLCGLV GAPAGYLRDL 
PAPLAGINLQ HGLLSHRAEL IKTLETDDGR VELRAVTGPD YGRIWDHELV AAVMKIAGDG 
TGDTRWKVPG LLDWSMMTHN PFVEVTKDTT TLYASDRDVF LFLVDDAHPI EAGRLPNGEP 
DLYFRGFYCW NSEVGSKTLG MASFYLRAVC MNRNIWGAEG FQEISIRHSK FAARRFVHEA 
APALERFANA STTPFINGIR AARETIVARK DDDRETFLRK RGFSKTETGR IIATVLNEEG 
RPPESIFDFV QGITAVARDK PQQDARLELE AKAGRLLASV R