Gene Caul_5329 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5329
Symbol
ID	5897157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	+
Start bp	37901
End bp	39124
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	65%
IMG OID	641550621
Product	hypothetical protein
Protein accession	YP_001672107
Protein GI	167621599
COG category	[R] General function prediction only
COG ID	[COG1373] Predicted ATPase (AAA+ superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.54087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCCTC GCCATGCCAT CGACCGGATC CGCGAAGCCC TGAGCGACAC CCGGGTGGTG 
CTGCTGGCGG GGCCTCGCCA AGCGGGAAAG ACGACCTTGG CCCGCTCGCT CGCCGAAGCC 
GGCCGCACCT ATCTGACCCT GGACGACGCG ACCACTCTCT CGGCTGCCAA GGCCGACCCC 
GCCGGCCTGG TGCGCGGCCT AGACAAAGCT GTCATCGATG AAGTGCAGCG GGCACCCGAT 
CTGCTTCTAG CGATCAAGGA CAGCGTTGAT CGGGACACCC GTCCGGGTCG CTTCCTCCTG 
ACCGGCTCAG CCAATCTAAT GACCCTGCCG CGCGTGGCCG ACTCCCTGGC AGGCCGCATG 
GAAACCATCC GCCTGATGCC TCTGGCGCAG TCGGAGATCC TGGGACAGCC GGCGTCACGG 
TTTCTCGCAT CCCTGTTCGC GGGCCAGGCA CCGCCGCCAG GCCCGCCTCG CCTAGGCGCG 
GACCTGATCG ACCTGGTCCT GGCGGGCGGC TATCCCGAGG CCCTCGCGCG TAAGACCTGG 
GCTCGCCGAC AGGACTGGTA CGCTAATTAT ATCGAGGCCG TGGTCGGGCG CGACGTGCGC 
GACATCGCCA ATATCGACCA ACTTGACCGT ATGCCGCGCC TGCTACGCGC CCTGGCCGAG 
CACTCGGGAC AGCTGATTAA TCACGCCGGC GTCGGCGCCA GTCTCGATCT CAACCATGTG 
ACGACGCAAA AATACACCGG CGTCTTTGAG CAGCTGTTCC TCGTGCGCAC CCTGCCGCCT 
TGGCACAACA ACGCCCTCAA ACGGCTGACT AAGAAGCCCA AACTGCACTT CCTCGACTCA 
GGCTTGCTCG CGGCGCTGAG GGGCCTGACC CCCGAACGCG TAGCCGCGGA CCGATCAAAT 
TTCGGTGCGG TGCTCGAGAC CTTCGTCTTC GCCGAAGTGC TCAAACTGAC TGGGTGGAGC 
GACGAGCGCT TCTCGCTAAG CCATTTTAGA GACAAGGAGC AGGACGAGGT CGATATCGTC 
CTAGAAGATC GACAGGGCAA GATCGTCGGC TTGGAGGTCA AGGGATCAGC GACGGTGCGC 
AGCGAGGATT TCGCGGGCCT GCGCAAACTG GCGCAGGCTG TGGGTGATCG CTTCGCGTTC 
GGGGCGGTAC TGTACGACTA TGAACAGGTC GTGCCGTTCG GCGAGCGCCT GGCCGCCGCG 
CCATTGTCCA GCCTTTGGGG TTAG

Protein sequence

MYPRHAIDRI REALSDTRVV LLAGPRQAGK TTLARSLAEA GRTYLTLDDA TTLSAAKADP 
AGLVRGLDKA VIDEVQRAPD LLLAIKDSVD RDTRPGRFLL TGSANLMTLP RVADSLAGRM 
ETIRLMPLAQ SEILGQPASR FLASLFAGQA PPPGPPRLGA DLIDLVLAGG YPEALARKTW 
ARRQDWYANY IEAVVGRDVR DIANIDQLDR MPRLLRALAE HSGQLINHAG VGASLDLNHV 
TTQKYTGVFE QLFLVRTLPP WHNNALKRLT KKPKLHFLDS GLLAALRGLT PERVAADRSN 
FGAVLETFVF AEVLKLTGWS DERFSLSHFR DKEQDEVDIV LEDRQGKIVG LEVKGSATVR 
SEDFAGLRKL AQAVGDRFAF GAVLYDYEQV VPFGERLAAA PLSSLWG