Gene Daci_4552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_4552
Symbol
ID	5750140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	-
Start bp	5007426
End bp	5008535
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	70%
IMG OID	641299653
Product	putative hemagglutinin-related protein
Protein accession	YP_001565566
Protein GI	160899984
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2706] 3-carboxymuconate cyclase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.846091
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.748883
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCT CAGCGTCGCG CCCCCTGTAC GCCTACGTGG GTTCGCGCAC CACGCGCGAG 
CGCGACGCAC GTGGCGAGGG CATCACCGTC TATCGCGTGG ACGAAGCCAC GGGCGGCCTG 
CAGCATCTGC AGACCGTGGA CGGGCTTTCC AACCCCTCGT TCCTGGCGCT CGATGCAGCC 
GGCACCCGGC TCTACACCGT GCATGGCGAT GGCCATGAGG TCAGCGTCTT CGCACGCGAT 
GCCGCAACGG GCCGCCTGGC GTTGCTGCAG ACCCGGGACT GCGGCGGGCG CAACCCGGTG 
CACCTGGCCA TCGCCCCGGG TGGACGGCAG CTGGTGGTCT CCGACCATCT GGGCGAGCCG 
GCTGCCAGCG ATGGCCACCA GGGGTATGGC GGGCCAGGCG GTACGCTGGC CGTGATGTCG 
ATCGCACCGG ACGGGCGCCT GGGCTCCGTG CAGCAGCGGC TTGCGCTACC GGGCCAACCC 
GGGCCGCATC GCAAGGAGCA GCCGTTTGCC AAGCCGCACT TCAACCCCTT CTCGCCGGAC 
GGGCGCTTCG TGCTGGTGCC TGACAAGGGG CAGGATCGGA TCTTCATCTT CGCCTTCGAG 
CACGGGCGGC TGGCGCCTGC GCCCCAGCCC TGGCTGGACT GCCGCGAAGG CTCGGGCCCG 
CGGCATATGG CCTTCCATCC TGCGCTGGCC TGCGCCTATG TGGTCAACGA ACTGGACAAC 
ACCGTGCTCA CCTGCCGCTT CGATGCGGCC ACGGGGGCGC TGCAGGGCTT GCAGATCCTG 
TCCACCCTGC CGGAGCGCTT TGTGGGCAAC AGCCGGGCGG CGGGCATCGA GGTCTTGCGC 
GACGGCCGGC AGGTGCTGGT GTCCAATCGC GGCGCTGACG GCATTGCGGT CTTCGATGTC 
GATCCTTTGA CGGGGCTGCT GCACGCCAGT GGCGGCTTCG CCTCGGGCGG GCGCACGCCG 
CGCTTTTTCA CGTCCTCGCC CGACGGGCGC CTGCTCTATG TGCTCAACGA GGACAGCGAC 
AGCATCGTCT GCCATGCCCC GGATGACGCC TGGCGCCCGC TGGCCAGCAC CCACTGCGCC 
AGCCCGGTGT GCATGGTGTT CGCGCGGTAG

Protein sequence

MSTSASRPLY AYVGSRTTRE RDARGEGITV YRVDEATGGL QHLQTVDGLS NPSFLALDAA 
GTRLYTVHGD GHEVSVFARD AATGRLALLQ TRDCGGRNPV HLAIAPGGRQ LVVSDHLGEP 
AASDGHQGYG GPGGTLAVMS IAPDGRLGSV QQRLALPGQP GPHRKEQPFA KPHFNPFSPD 
GRFVLVPDKG QDRIFIFAFE HGRLAPAPQP WLDCREGSGP RHMAFHPALA CAYVVNELDN 
TVLTCRFDAA TGALQGLQIL STLPERFVGN SRAAGIEVLR DGRQVLVSNR GADGIAVFDV 
DPLTGLLHAS GGFASGGRTP RFFTSSPDGR LLYVLNEDSD SIVCHAPDDA WRPLASTHCA 
SPVCMVFAR