Gene Caul_3423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3423
Symbol
ID	5900878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3699668
End bp	3701176
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	69%
IMG OID	641563929
Product	Sel1 domain-containing protein
Protein accession	YP_001685048
Protein GI	167647385
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.346292
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGAGA CCAGCAATGC TGTTTCTCAC CTCGCCGTTC TCAAGCGGGG CTTGGCCAAC 
ATGGTCGACA ACCGCGCGTC GCTGCTCCGC CGCCTGCCGG TTGGGGCGCT GGTCGCGGCG 
GTGGTGATTC CGCTGGTCGG CTGCGACACC GGTCCCAGTT TCTGGTTCCA CAAGCGCGCC 
AGCGCCTGCC CTCGTCCTCA GGCGGCGCAA GGGGTTTCCG GCCAGTTCAA TCAGCAGCAG 
CAGGAAATCC GCTCGCTTCG CCAGGGCGGC TTCCGTGGCG ACTTCTTCGC CCAGCTCGAG 
CTGGCCCGCC GCTACGAGGG CCAGCGGGCG GTCGACAAGA ACCTCGAGGA TCCGGTCGAG 
GCGGCGGTCT GGTACGCCAT GGCCCTGTCC AACGCTGGCG GCTATTCGCC GATCGCCGCC 
TATGAGCGGC GGGGCGGCCG GGATGAAGGC CCGCTGTCGC GATTCGACGA CTGCCGGGCC 
TTCGAGCGTC ACGCCGCCTA CGGGGCGCTC GACCGCTTGC TGTCGCGAAT GTCGACCGAG 
GAGCGCGAGA AGGTCCGCAA CCGCGTGATC TACATCCTTT CCACCCAGGG CGCCGACGGC 
TACCGGGTGC TGGCGCGCAT GCACGACGGC TTCTTCGGCC CGTTCGGCGA GCCCTCCGAC 
AACCTGCAGG CCATCGAGGC CTACGGCACG CCCAAGCGCA CCGGCGCCCC CGCGGCCCTG 
GATCTGTTCC GCCGCAACGA CGTCGACGCC TATCTCTATA ACTATCTGGC GGTGCAGACC 
GGCGACGTGT CGGCCTACGT GATGCTCAAG GACTTCGAGC GCTCCTCGCC GCAGCGGGCC 
TCGTATGGCG GCTTCGTCGA GACCAAGGCC AAGCGCTGGA TCCCGCCCTA CGAGTTCTAC 
CCGCCGGAAT CGCCCGACTC CGGCGTGCCG CATTCCGACG AGAGCGATCC GTCGGGCGAC 
AGCAAGGAGG CGGCCCTGGC GCGCCTCAAC GAGCTGCCCT TCGTGCATAT CGGCGAGGCC 
CTGGCCTATC TGCGGGTGAT CCCAGCGCCG GTGCTGGACG AGCGGATGCT CAGCGTCAAT 
GAGGCCCAGA CCTTCCAGGC GATGGTCGGC CGGCCCATCA CTGGCCGCCT CTCGGGCATC 
GAGAAGGTGC GGGCGATCCA GTACGCGGCG GTCAACGGCT CGTCCAAGGC CCAGCTGGTG 
CTGGCGGTGA TGTATTCCGA AGGCGTCGGC GTGCCGCGCG ACTACGCCCG GGCCTATCAC 
TGGTACGAGG AGGCCGAGCG GCAGGGATCG GCCGAGGCCA AGTACGCCAT GTCGACCTTC 
TTCTCGCTGG GCCTGCAGGG CGTGGCCGAC CAGGATCGGG CCAAGGCCGT GGTCTACCAG 
CTGGACGGCG CCCTGGCCGG CTTCAAGCCG TCGGTCTGGC GGCTGCAACA GCTGCTGTCG 
CAGGTCTCGC GGCCGCCGCG CGCCGTCGCC GAGCGACCCC AGCCCTATGC CGAAAGGGAC 
TATCGATGA

Protein sequence

MHETSNAVSH LAVLKRGLAN MVDNRASLLR RLPVGALVAA VVIPLVGCDT GPSFWFHKRA 
SACPRPQAAQ GVSGQFNQQQ QEIRSLRQGG FRGDFFAQLE LARRYEGQRA VDKNLEDPVE 
AAVWYAMALS NAGGYSPIAA YERRGGRDEG PLSRFDDCRA FERHAAYGAL DRLLSRMSTE 
EREKVRNRVI YILSTQGADG YRVLARMHDG FFGPFGEPSD NLQAIEAYGT PKRTGAPAAL 
DLFRRNDVDA YLYNYLAVQT GDVSAYVMLK DFERSSPQRA SYGGFVETKA KRWIPPYEFY 
PPESPDSGVP HSDESDPSGD SKEAALARLN ELPFVHIGEA LAYLRVIPAP VLDERMLSVN 
EAQTFQAMVG RPITGRLSGI EKVRAIQYAA VNGSSKAQLV LAVMYSEGVG VPRDYARAYH 
WYEEAERQGS AEAKYAMSTF FSLGLQGVAD QDRAKAVVYQ LDGALAGFKP SVWRLQQLLS 
QVSRPPRAVA ERPQPYAERD YR