Gene Caul_4788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4788
Symbol
ID	5902250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	5174329
End bp	5175450
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	65%
IMG OID	641565308
Product	hypothetical protein
Protein accession	YP_001686406
Protein GI	167648743
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATTC CCGCATCGAT CACCGGTCGC AACGCCCTGG TGTTCCTGGC GGTCGTCGCC 
GGGGGCGCGG CCCTCTACTG GATGCGGGGC ATCCTCACGC CCCTGGCCAT GGCGGTGTTC 
CTGGCGGTGA TGATCGACAG CTTCGCCCGC GTGTTGGTGC TGCGCGTCCC GCGCTTTCCC 
AGAAGCCTGG CCCTGCCCAC CGCCATCGTC CTGTCGATCG GCATGTTCGC GGCGGCTGTC 
TGGGTGGTGA CCTCGAACGG GGCGGGGTTC GTGGGCCAGA TCCGCGACTA CGCGCCGCGC 
CTCAATGAAG TCATCGCCAA GATCGCCTCG CTGGTCGGCG TGAAGGTCGC CCCGACCATC 
GGCGACCTGA TCAATCAGCT CAATCCCTCG GCCTATGCCG GGGCGGCCGC CCAGAGCCTG 
CAGAACTTCG CCTCCAGCGC CATCCTGGTG CTGATCTATC TGGGCTTCAT CATCGCCTCT 
CGACGCGGTT TCAACCGCAA GATCGTGGCG CTCTATCCGC ACCATGCCGA ACGTGACGGG 
GCGATGCAGC TGTTCCAGCG CATCCGGAAC GGGGTCGAGC AATACCTCTG GATCCAGACC 
GTGACCGGCC TGATGATCGC CATCGCCGCC TTCGTGGTCA TGATGCTGCT GCGGCTCGAC 
AACGCCCTGT TCTGGGCCTT CCTGATCTTC GTGGCCGCCT ATATCCCGAT CATCGGCGGA 
GCCATCGGCT GTATCCTGCC GCCGCTGTTC GCCCTGGTGC AGTTCCCCGA CAGCTTCTGG 
CCGGCCCTGA TCCTGTTCGC CGCCCTGGAG CTGATCTTCT TCGTCGTCGG CAACGTCATC 
TATCCGCGGA TGCAGGGCGA CAGCCTGAAC ATCGACCCGA CGGTGGTGCT GCTGTCGCTG 
GCCGTCTGGG GCGCGCTCTG GGGCGTGACG GGCATGTTCC TGTCGACTCC GCTGACCGTG 
GCCCTGATGC TGATCATGGC CCAATTCGAC GGCACGCGCT GGATCGCCAT CCTGCTGTCG 
GAAGACGGTA ATCCCAGTGG CGACGGCTTT GACCGCACGT CGCCGGGGAA AAAAAATCCT 
TCCGAGTCAA CTTCTCGACA GAAGTCGATC AAGGGGGCTT AA

Protein sequence

MAIPASITGR NALVFLAVVA GGAALYWMRG ILTPLAMAVF LAVMIDSFAR VLVLRVPRFP 
RSLALPTAIV LSIGMFAAAV WVVTSNGAGF VGQIRDYAPR LNEVIAKIAS LVGVKVAPTI 
GDLINQLNPS AYAGAAAQSL QNFASSAILV LIYLGFIIAS RRGFNRKIVA LYPHHAERDG 
AMQLFQRIRN GVEQYLWIQT VTGLMIAIAA FVVMMLLRLD NALFWAFLIF VAAYIPIIGG 
AIGCILPPLF ALVQFPDSFW PALILFAALE LIFFVVGNVI YPRMQGDSLN IDPTVVLLSL 
AVWGALWGVT GMFLSTPLTV ALMLIMAQFD GTRWIAILLS EDGNPSGDGF DRTSPGKKNP 
SESTSRQKSI KGA