Gene Caul_2446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2446
Symbol
ID	5899901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2668431
End bp	2669681
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	70%
IMG OID	641562937
Product	hypothetical protein
Protein accession	YP_001684071
Protein GI	167646408
COG category	[S] Function unknown
COG ID	[COG3174] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.385923
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.422644
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCGG AACCCTTCGA ACGGCTTGGA CTGGCCTTGG CCATCGGTTT CCTGATCGGC 
ATCGAACGCG GCTGGCGCGC GCGCGAGGTC GCCGAAGGAG GACGCGCCGC GGGGTTGCGC 
ACCTACGCCC TGTCGGGTCT GCTCGGCGGG GTCTCGGGGA TGCTGAGCCA AGCCCTGGGC 
GGCTGGGCCA TGCTGACGCT CGGACTGCCG TTCGCCGCGG CCTTCATCCT CTTCAAACGG 
CAGGAACAGC GAGACGACAA CGACTATTCC GTCACCGCCA TCGTCGCGGG CCTGCTGACC 
TTTGGTCTCG GGGCGCTGGC GGCGATCGGC GATGAGCGGG TCGCCGCCGC CGCCGCCGTG 
GCGGTCGCGG CTCTACTGGC GGGCAAGGAG GTGTTGCATA CCTGGCTCAA GCGCCTGACC 
TGGCCCGAAC TCCGAGACGC GCTGGTCCTG CTCGCCATGA CCTTCGTGGC CCTGCCGCTT 
TTGCCAAACC GTCCCTTTGG ACCCTACGGC CTGGTCAATT TCGCCGAACT CTGGGTGCTG 
ACCATCGCCA TGGCGGGGAT TTCCTTTGTC GCCTACGCCG CGATCAAGGT GTGGGGGCCG 
GCGCGTGGCG CCTTGCTGGC CAGCGCGGCT GGCGCGCTGG TCTCTTCGAC GGCGGTGACC 
TTCTATCTGG CTCGACTGCA GAAGACGGTC TCCAACCCCC TTGCCCTGGC GGGCGCGGCT 
CAGGTGGCCA GCGCCGTCAT GGCGATCCGG CTGGGCGCCA TAACCTTGGC GCTTTGGCCA 
CCCCTGTTCT GGTCGCTGGC CGCGCCGCTC GGGGTGTTCG CCGCCCTCTC GACGATCTTT 
GGCCTAGGGG CGACCGCCTT CGCATCGACC AGGGACGCCT CGCCGTCGCC ATCCTCGGCC 
AAGAGTCCAT TTGAACTGGC GCTGGTGTTG AAATTCGCGC TGGCGCTGGG CGTCATCATG 
GCGGCGGCCA GGGTCGCCGC CGGCCTCTAC GGTCCGTCCG GCCTCCTGCC CGTGGCGGCG 
CTTGGCGGCC TGGTCGACGC CGACGCGGTC ACTCTGGCGG CCGCCCGCAT GACCTCGAAA 
GGCATGGCCA TCGGCATCGC CGGCCAGGCG GTGCTCCTGG CCGCGGCGGT CGACAGCGTC 
TCAAAGATGG TCATCGCCTG CGCGGTGGGC GGCTCGCGCT TTGGGGCGCT CTATTCGGCG 
GGCACCCTGT TGGCGCTGGG CGCCGCGGCC GGCGCCTGGG CATGGGGCTA G

Protein sequence

MAAEPFERLG LALAIGFLIG IERGWRAREV AEGGRAAGLR TYALSGLLGG VSGMLSQALG 
GWAMLTLGLP FAAAFILFKR QEQRDDNDYS VTAIVAGLLT FGLGALAAIG DERVAAAAAV 
AVAALLAGKE VLHTWLKRLT WPELRDALVL LAMTFVALPL LPNRPFGPYG LVNFAELWVL 
TIAMAGISFV AYAAIKVWGP ARGALLASAA GALVSSTAVT FYLARLQKTV SNPLALAGAA 
QVASAVMAIR LGAITLALWP PLFWSLAAPL GVFAALSTIF GLGATAFAST RDASPSPSSA 
KSPFELALVL KFALALGVIM AAARVAAGLY GPSGLLPVAA LGGLVDADAV TLAAARMTSK 
GMAIGIAGQA VLLAAAVDSV SKMVIACAVG GSRFGALYSA GTLLALGAAA GAWAWG