Gene Daci_5092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_5092
Symbol
ID	5750703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	-
Start bp	5645153
End bp	5646283
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	67%
IMG OID	641300216
Product	cupin 4 family protein
Protein accession	YP_001566106
Protein GI	160900524
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.581531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.0289513
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACCA ACACACCGCT TGCCCTGCTG GGCGGGCTTA CCGCTTCCCA ATTCATGCGC 
CGCCACTGGC ACAAGAAGCC CTTGCTGGTG CGCCAGGCAA TCCCGGGCTT CAAGCCCCTG 
ATTCCCCGCG CCAGGCTGCT GGCCATGGCA GGCGAGGACG GTGTGGAGTC GCGCCTGATC 
CAGCAGCAGG ACGGTGGCCA ATGGAAGCTC AGCCACGGCC CGCTGTCGCG CCGCAGCCTG 
CCCTCGCTGC AAAAGCCCGG ATGGACCGTG CTCGTGCAGG GCGTGGACCT GCACGACGAC 
GGCGTGCACC AGCTGATGCA GCAGTTCCGC TTCGTGCCCG AGGCGCGGCT GGACGATCTG 
ATGATCAGCT TTGCCACCGA CCAGGGCGGC GTGGGCCCGC ATTTCGACAG CTACGACGTC 
TTCCTGCTGC AGGCGCATGG CCGCCGGCGC TGGCGCATCG GCCGCCAGAA GGACCTTTCG 
CTGCAACCCG ATGTGCCGCT GAAGGTGCTC TCGAATTTCG AGCCCGAGGA GGAGTTCGTG 
CTCGAGCCCG GTGACATGCT CTACCTGCCG CCCAAGTGGG CCCATGACGG CATCGCCGAG 
GGCGAGTGCA TGACCTACTC CATCGGCTTT CGCTCGCCCG CGCGCGACGA ACTGGCCCGC 
GAGCTGCTGC TGCGCATGTC CGACGAGCCC GATGAACCCG AAGCGCCCAT GGTCTACCGC 
GATCCCGACC AGCCCGCCGT CGAGGCTCCG GGCGAGATTC CGTCGAGCCT GCACGACTTC 
GCGCGCAAGG CGCTGGAGCG CGCGCTGGCC GAGCCGCTGG CGCTGGAGCG CGCGCTGGGC 
GAGTACATGA CCGAGCCCAA GGCCAATGTC TGGTTCGAGC ATGGCGAGGA GCACGGCATG 
TTCGAGAGCG TGGTCCTCGA TCGCCGCACG CGCATGATGT ATGACGCAAA ACACATCTTC 
ATCAACGGCG AAAGCTATCT GGCCGGTGGC CGCGATGCCA CCCTGATGCG CAAGCTGGCC 
GATACGCGCG CCCTGTCACG CGCCGACCTG GCCAAGGCCA GCGATGACGC GCTGGAGCTG 
CTGTCCTCCT GGTTTGACGC CGGCTGGGTG CGAGGCGGGC CGCTGTCCTG A

Protein sequence

MDTNTPLALL GGLTASQFMR RHWHKKPLLV RQAIPGFKPL IPRARLLAMA GEDGVESRLI 
QQQDGGQWKL SHGPLSRRSL PSLQKPGWTV LVQGVDLHDD GVHQLMQQFR FVPEARLDDL 
MISFATDQGG VGPHFDSYDV FLLQAHGRRR WRIGRQKDLS LQPDVPLKVL SNFEPEEEFV 
LEPGDMLYLP PKWAHDGIAE GECMTYSIGF RSPARDELAR ELLLRMSDEP DEPEAPMVYR 
DPDQPAVEAP GEIPSSLHDF ARKALERALA EPLALERALG EYMTEPKANV WFEHGEEHGM 
FESVVLDRRT RMMYDAKHIF INGESYLAGG RDATLMRKLA DTRALSRADL AKASDDALEL 
LSSWFDAGWV RGGPLS