Gene Caul_0479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0479
Symbol
ID	5897934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	520198
End bp	521793
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	67%
IMG OID	641560962
Product	TRAG family protein
Protein accession	YP_001682111
Protein GI	167644448
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3505] Type IV secretory pathway, VirD4 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.903949
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCGA CACGCATCCT TTGGGCGCCG GTGATCGTCG TCTTCGTCCT GGTCCTGGCG 
ACGACCTGGG GCGCGACCCA GTGGACGGCC AACGCCCTGG GCTACCAGCC CGAACTTGGC 
GCGCCCTGGC TGATCATCGG CGACCATCGC CTCTATCCGC CGCCCGCCTT CTTCTGGTGG 
TGGTTCGCCT ATGACGCCTA TGCGCCGCGC ATCTTCCTGC AGGGCGCGGC CATCGCCGTC 
TCGGGCGGCC TGCTGTCCCT CGTCGCGGTC ATCGGCATGG CGGTATGGCG GGCTCGGGAG 
AGCGGCAAGT CCAGCGCGTT CGGCACGGCG CGGTGGGCGA TCCCACGTGA GGTCCGCGCC 
GCCGGACTGC TCGGTCCCGA CGGCGTGATC CTGGGGCGCC TCGACAAGGC CTATCTGCGC 
CATGATGGCC CCGAGCATGT ATTGTGCTTT GCCCCGACGC GCTCGGGCAA GGGTGTGGGC 
TTGGTCGTTC CCAGCCTGCT GACCTGGCCC GGCTCGGCGA TCGTCCATGA CATCAAGGGC 
GAGAACTGGA CCCTGACGGC CGGCTTTCGC GCGACGTTCG GCAAGGTCCT GCTGTTTGAT 
CCGACCAACC CCGGGTCCTC GGCCTACAAT CCCCTGCTGG AGATCCGGCG CGGCGTCTTC 
GAGGTGCGCG ACGTTCAGAA CGTGGCCGAC ATCCTGGTCG ATCCGGAAGG TTCGCTCGAC 
AAGCGCAGCC ACTGGGAAAA GACCAGTCAT TCTCTGCTGG TCGGGACGAT CCTCCACGTC 
CTCTATGCCG AACCGGACAA GACCTTGGCC GGGGTCGCGG CCTTCCTGTC CGATCCGCAA 
CGGACGATCG AACAGACGCT CGATGCGATG ATGCGCACGC CGCATCTGGG GGCGGACGGG 
CCGCACCCCG TCGTCGCCAG CGCGGCGCGC GAACTCAAGA ACAAGAGCGA CAACGAACGC 
TCCGGGGTCT TGAGCACGGC GATGACCTTC CTGGGTCTCT ATCGCGACCC GACGGTGGCC 
CAGGTGACAC GGCGCTGCGA CTGGCGTATC GCCGATCTCG TCGATGGCGG ACCCTGCACC 
CTCTACCTGG TGGTTCCGCC CTCGGACATC AGCCGGACCA AGCCGCTGGT GCGACTGCTG 
CTCAACCAGA TCGGCCGTCG CCTGACCGAA CAGTTGGCTG ACACCGCTGG CCGCCAGCGG 
GTGCTGCTGA TGCTCGACGA GTTTCCGGCC CTGGGGCGCC TGGACTTCTT CGAGAGCGCC 
CTAGCCTTCA TGGCCGGCTA TGGCCTCAAA GCATTTTTGA TCGCCCAATC GCTTAGGAGC 
GCGCTGGATG TTCTCCGCCA GGCTGTCCTC CTCGGCCAGA CCCTCGGTGC GGACCACGCA 
GGGGATCAGG GCGTTGCGGG CCAGACGCTT CTGCTTGACC AGCAGTTCCA GAGCTCGATA 
GCGCCGGCCG CCGGCCGGGA TCTCGAACAT GCCGGTCTCG GCGCCGCCGG CGTCCAGCAC 
GGGCCTAACG CTCAGCCCGT GCAACAGCGT GCGCCGGGCA ATGTCGTCGG CCAGTTCGTC 
GATCGACACG CCGGCCTTGG TGCGGCGGAC ATTTGA

Protein sequence

MSATRILWAP VIVVFVLVLA TTWGATQWTA NALGYQPELG APWLIIGDHR LYPPPAFFWW 
WFAYDAYAPR IFLQGAAIAV SGGLLSLVAV IGMAVWRARE SGKSSAFGTA RWAIPREVRA 
AGLLGPDGVI LGRLDKAYLR HDGPEHVLCF APTRSGKGVG LVVPSLLTWP GSAIVHDIKG 
ENWTLTAGFR ATFGKVLLFD PTNPGSSAYN PLLEIRRGVF EVRDVQNVAD ILVDPEGSLD 
KRSHWEKTSH SLLVGTILHV LYAEPDKTLA GVAAFLSDPQ RTIEQTLDAM MRTPHLGADG 
PHPVVASAAR ELKNKSDNER SGVLSTAMTF LGLYRDPTVA QVTRRCDWRI ADLVDGGPCT 
LYLVVPPSDI SRTKPLVRLL LNQIGRRLTE QLADTAGRQR VLLMLDEFPA LGRLDFFESA 
LAFMAGYGLK AFLIAQSLRS ALDVLRQAVL LGQTLGADHA GDQGVAGQTL LLDQQFQSSI 
APAAGRDLEH AGLGAAGVQH GPNAQPVQQR APGNVVGQFV DRHAGLGAAD I