Gene Caul_1678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1678
Symbol
ID	5899133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1766132
End bp	1767196
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	71%
IMG OID	641562168
Product	permease YjgP/YjgQ family protein
Protein accession	YP_001683305
Protein GI	167645642
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.936868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.549476
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCC AGCTCTACGT CCTGCGAACG GTCGGCACGC GCGTGCTCGG CGCCGGCCTG 
ATCCTGTTCT CGATCCTGCA GATCCTCGAC CTGCTGGAAG TGACCACCGA CATCATCGAC 
AGAGGCCTGG GTACGGCCGG CGTGTTGTAC TACGCCGCCC TGCGTTCGCC GCGCCTGGTC 
GAGCAGGTGG CGCCGCTGGC CACCCTGGCC GGCGGCCTGT TTGCTTTCTC CCAGCTGGCC 
CGCGAAAACG CGATCATCGC CATGCGCGCC ACCGGGATAT CGGCCTATCG CATCGTGGGC 
ATGGCCCTGC CGGTGGTCTT CCTGGTCATG GCCCTGGACT TCAGCTGCGC CCAGATCATC 
GCCCCGCGCA CCGATCCCGT GCTGGCCGAC TGGTGGCAGG CCACCACCCC CGCCGCCGAA 
CGCAAGGTTC CGGGTCCGCG CAGCTTTCGG GCTGGCGACG ACCTGGTGAT CGCCGCCGGG 
GCCTCGGCCG ATGGGGGGAC CCTGAACGCC GTGAAGATCT ATCGCCGCGA CAAGATCGGC 
CGGCTGATCG AGCGCATCGA GGCGCCGTCG GCGTCCTACA ACTCCGGCGG CGGCTGGACC 
CTGGCCAAGC CGGTGATCGT CCGGTTCAAG GGCGAGCAGG TCAATGTCGT GCCGGCCGCC 
CAGTTGAGCT GGCCCTCGCC CCTGCACCGG CAGGACGTGC AGGCCCTGTT CGCCGACAGT 
CCCGTCCCCA CCGCCGCCAC CGCTCGCCGC GCCCTGCTGA GCGGTGGCGG CGACCGCCCC 
GCCGCCTTCT ACGAAACCCG CTTCCTGTCG GCCTTCGCCG GGCCGTTCGC GGCTCTGGTC 
ATGCTGCTGC TGAGCGCGCC CGTCGCCCTG GCCAATTTCC GCAGCGGACA GGGCGCGGGG 
CTGCTGGCCG GCGGCCTGGC GGCGGGGCTG CTGTTCCTGG TGGTCAACGG CATGCTCTCG 
GCCCTGGGCG AAGGCGGCTC GCTGTCGCCC ATCCTGGCTG TCTGGGGCGG CCCGGTGATC 
TTCGCCGCCC TCGCGGTCTA CGCGCTTGTT GTTCTGGAGG GCTGA

Protein sequence

MKIQLYVLRT VGTRVLGAGL ILFSILQILD LLEVTTDIID RGLGTAGVLY YAALRSPRLV 
EQVAPLATLA GGLFAFSQLA RENAIIAMRA TGISAYRIVG MALPVVFLVM ALDFSCAQII 
APRTDPVLAD WWQATTPAAE RKVPGPRSFR AGDDLVIAAG ASADGGTLNA VKIYRRDKIG 
RLIERIEAPS ASYNSGGGWT LAKPVIVRFK GEQVNVVPAA QLSWPSPLHR QDVQALFADS 
PVPTAATARR ALLSGGGDRP AAFYETRFLS AFAGPFAALV MLLLSAPVAL ANFRSGQGAG 
LLAGGLAAGL LFLVVNGMLS ALGEGGSLSP ILAVWGGPVI FAALAVYALV VLEG