Gene Caul_4191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4191
Symbol
ID	5901653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4555715
End bp	4557301
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	72%
IMG OID	641564713
Product	pilus assembly protein CpaE
Protein accession	YP_001685813
Protein GI	167648150
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4963] Flp pilus assembly protein, ATPase CpaE
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGC GCACCGATCA CGACCCCTTC GACCTGGGCT TCGAGGCCGA CGACGAGTTC 
GCCGCGCCGG GTTCCGATCC GTGGCGCGCC GCGTCGTCGC CGCCGTCGCG CGCCGAGGAT 
CCGTTCGCCG ACTTCCCGCC CGCCCGCCCG GGCGAGAGCG CGCCCTCGGC GTTCATGGAC 
CTGCCGCCGT CCGCGCCGCC CTATGTTCCA AAGGCGCCGG CCGCCGCCGT CGCGTCGCAG 
TCGCCGTCGC CGACGGTCGC CCCAGCCGCA CCCAAGGTCG CCCAGCCCGT GGCGGTCGAC 
GCCGCCATCG CCGTCGCGCC CGCGGTCCAT CCGGTCGGCA GCACCCAGGC CATGGTCCAG 
GAGGTGGTCG CCGCCGCCGA GGCCGACATG GGCGAGGCGG CCGTGCCGCG CATCACCATC 
CACGCCTTCT GCGCCCGGCC CGAGACCGTC GCCCTGGTCG AGGCCGCCTC GGCCGACCGT 
CGCATGGTTC GCGCCTCGAC CGTCGCCCGG CCCGGCGGCC TGGCCGCCGC CGTCGACTAC 
TACCAGAACC AGTCCACCCC CTCGCTGGTG CTGGTCGAGA GCCTGGATTC CGCGCCGCTG 
ATGCTGTCCC TGCTGGACGG CCTGGCCCAG GTCTGCGACC CGGGCACCAA GGTCGTGGTC 
ATCGGCCAGA CCAACGACAT CGCCCTCTAT CGCGAACTGA TGCGCCGCGG CGTCAGCGAA 
TACCTGACCC AGCCGTCCGG CCCGCTGCAG ATCATCCGCG CGGTGTCGAA CCTCTATGCC 
GATCCGTCCG CGCCGTTCGT CGGCCGGCAG ATCGCCTTCG TCGGCGCCAA GGGCGGCGTC 
GGCTCCTCGA CCCTGGCCCA CAACTTCGCC TGGTCGATGG CCGAGCGCAT CCAGGCCGCC 
ACCGTGATGG TCGACCTGGA CCTGGCGTTC GGGACCGCCG GCCTCGACTT CAACCAGGAC 
CCGCTGCAAG GCATCATCGA CGCCCTGGGC CAGCCCGAAC GGCTGGACGC GGTGCTGATG 
GACCGGATGA TGGTCCGCTG CGGCGACCGC CTGTCGCTGT TCGCCGCGCC GGGCGCCCTG 
GACCAGGACT ACGAGATCCC TGCCGACGCC TTCGAGGAAG TCACCCAGAA GATCCGCGGC 
GCCGCGCCGT TCGTGGTGCT GGACCTGCCG CACAGCTGGT CGGCCTGGAC GCGCCGGGTG 
CTGATCTCGA GCGACGACCT GGTGGTGGTG GCGACGCCCG ACCTGGCCTC CCTGCGCAAC 
GCCAAGAACA TCGTCGACCT GGTCCGCCAG GCCCGACCCA ACGACGCGCC GCCCCGCCTG 
GTGCTCAACC AGGTCGGCGT TCCGGGACGT CCCGAGATTC CGGTCAAGGA CTTCGGCGAG 
GCCCTGGGCC TGACGCCCTC CCTGGTGCTG CCCTTCGATC CCAAGCCCTT CGGCATGGCC 
GCCAACAACG GCCAGATGGT CGCCGAGGTG GCCCCCAAGT CGAAGGCCGC CGAGGGCATC 
GACCACCTGG CCCGGCTGAT CAGCCGTCGC GAGCCGCCGC CGGCCCAGAA GGCCTCGGTG 
CTCTCCGGCC TGTTCAAGAA GAAGTAG

Protein sequence

MTKRTDHDPF DLGFEADDEF AAPGSDPWRA ASSPPSRAED PFADFPPARP GESAPSAFMD 
LPPSAPPYVP KAPAAAVASQ SPSPTVAPAA PKVAQPVAVD AAIAVAPAVH PVGSTQAMVQ 
EVVAAAEADM GEAAVPRITI HAFCARPETV ALVEAASADR RMVRASTVAR PGGLAAAVDY 
YQNQSTPSLV LVESLDSAPL MLSLLDGLAQ VCDPGTKVVV IGQTNDIALY RELMRRGVSE 
YLTQPSGPLQ IIRAVSNLYA DPSAPFVGRQ IAFVGAKGGV GSSTLAHNFA WSMAERIQAA 
TVMVDLDLAF GTAGLDFNQD PLQGIIDALG QPERLDAVLM DRMMVRCGDR LSLFAAPGAL 
DQDYEIPADA FEEVTQKIRG AAPFVVLDLP HSWSAWTRRV LISSDDLVVV ATPDLASLRN 
AKNIVDLVRQ ARPNDAPPRL VLNQVGVPGR PEIPVKDFGE ALGLTPSLVL PFDPKPFGMA 
ANNGQMVAEV APKSKAAEGI DHLARLISRR EPPPAQKASV LSGLFKKK