Gene Ping_2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ping_2014
Symbol
ID	4626520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Psychromonas ingrahamii 37
Kingdom	Bacteria
Replicon accession	NC_008709
Strand	+
Start bp	2450553
End bp	2452655
Gene Length	2103 bp
Protein Length	700 aa
Translation table	11
GC content	44%
IMG OID	639797175
Product	glycoside hydrolase, clan GH-D
Protein accession	YP_943377
Protein GI	119945697
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3345] Alpha-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.63887
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA TCATTCATCT TACCAGCAAA AACTGCAGCT TGATCATCAA GGTTGAAACT 
ACCCCTGAAA TTCTTCATTG GGGGCCAAAA ATAAATCAGA TTGATCCCGA TATTCTGCTC 
GCTACCGAGC GGCCTATTCC CCAAGCGCGC CTTGATGTTG ATGTGCCGCT TTCTTTATGT 
CCTGAGTTAG GCAGTGGTCA TTTTAATGCA CCCGGTCTGG AAGGTCATCG TGAAAGTTTT 
GATTGGGCCC CTGTTTTTGA AGTATTTGAT CAGGATTTGG CAGCGCAGTC TGTCGTCTTT 
AAACTGCAGG ATAAGGTTGC CAAACTGCAG TTAGAGATTG AAATAAAACT GGATTTTGAA 
AGTGATGTTA TCCAAAAACG TATTAAAGTT ATTAACACCG GTGAGACTAA ATATTCTTTA 
ACCAAGCTTT CTTCTACCCT GCCCCTGCCA AACCATGCTA ATGAACTGAT GTCTTTCCAC 
GGTCGTTGGA GTCGTGAATT CCAAACCCAT CGTCAACGTT TCGCGCACGG TGGTTTTATG 
CAGGAAAACC GTCGTGGTCG AACTTCTCAC GAAAATTTTC CTGGTCTATT TGTCGGCAGC 
GATCATTTTA ATGAACAAAA TGGTCAAGTT TGGGGCTTTC ATTTAGGTTG GAGTGGTAAC 
CATCAACTGC GTGCGGATGT AAGAAGTGAC GGTCGCCGTT TTGTGCAGGC GGGTGAATTA 
TTACTCTCTG GAGAAGTTGT TTTAGGGGCA TTAGAAAGTT ATAGCACCCC CTGGTTATAC 
GCAACTTACA GTGCAGCGGG TCTTAACGGT ATTTCTGAGC ACTTCCACCG TTTTGTGCGT 
GATAATATTA TTAAATTCCC AGAGGATAAA CCCCGTCCGG TGCACCTGAA TACCTGGGAA 
GGTATCTATT TCGAGCATGA TCCACAATAC ATTATGAAGA TGGCGAATGA AGCCGCTGTA 
ATGGGTGTTG AACGCTTTAT TATTGATGAT GGCTGGTTTA TTGGGCGACA TGGGGAACGT 
GCGGCACTCG GTGATTGGTA CCTTGATAAG GAAAAATATC CAAATGGTTT AGAGCCCGTT 
ATTAAACACG TCAACGATCT GGATATGGAG TTTGGTTTGT GGGTTGAGCC GGAAATGGTC 
AGCGAGGAAT CAATGCTGTA CCGCGCTCAT CCGGATTGGG TTTTAGCGTT ACAGGGTTAC 
CATCAACCTT CTGGTCGCTG GCAATATGTG CTGGATTTAC AAAATACAGC ATGTTTCAAC 
TACCTGTTTG AACGCTTAAA CGATCTCTTA ACACGTTACA ATATCTCTTA CCTAAAATGG 
GATATGAACC GTGAGTTAGT ACAACCTGGA CATCAGGGTA AACCGGCGGT CAGTGGGCAG 
ACTAACGCCT TATACGCGTT GCTTGATAAA TTATTAGCGG TCCACACGGA AGTTGAAATT 
GAATCCTGTT CATCGGGTGG CGGACGCATT GACTTTGAAA TTCTCAAACG TACTCATCGT 
TTCTGGCCAT CGGATTGTAA TGATGCGTTA GAGCGTCAAA CTATCCAACG CGGCATGAGC 
TACTTCTTCC CACCGGAAGT GATGGGCACC CATATCGGCC CGGAAGAAAG TCATACAACA 
CGCCGTGTTC ATCATATCAA TATGCGCGGT ATGACAGCAT TAAGCGGGCA CATGGGAGTG 
GAATTGGATC CTGTTAAAGT GCCGGTAGAG GAAAGACAAG CCTTTGCTAA ATATATTGCA 
CTGCATAAAC AATACCGTCA CTTATTACAT AGCGGTCGCA GTTTCCGTGT CGATACTGCA 
GATAATAGTC AAAATATTTA TGGCGTCCAT AATAACGATG AAATGCTAAT CACCGTCTGT 
CAATTAACCA TGCCCGATTA TGCACTGCCG TCACCACTGC GCATTAGCTG CATCGACACA 
ACGGCTCAAT ATCAAGTTAA CTTAGTTGAG ACCCCTGAAA ACAGCTTCCA ATTAATGAAG 
CAACGCCCTA AATGGTTAGA TAAAACCCTT ACTTTAAGCG GTGAAAGCCT GAAAGAAATC 
GGGCTGAGCT TGCCTATTCT TGATCCGGAA TCAGCGCTTA TGCTGCACTT GAAAAAACGA 
TAA

Protein sequence

MKNIIHLTSK NCSLIIKVET TPEILHWGPK INQIDPDILL ATERPIPQAR LDVDVPLSLC 
PELGSGHFNA PGLEGHRESF DWAPVFEVFD QDLAAQSVVF KLQDKVAKLQ LEIEIKLDFE 
SDVIQKRIKV INTGETKYSL TKLSSTLPLP NHANELMSFH GRWSREFQTH RQRFAHGGFM 
QENRRGRTSH ENFPGLFVGS DHFNEQNGQV WGFHLGWSGN HQLRADVRSD GRRFVQAGEL 
LLSGEVVLGA LESYSTPWLY ATYSAAGLNG ISEHFHRFVR DNIIKFPEDK PRPVHLNTWE 
GIYFEHDPQY IMKMANEAAV MGVERFIIDD GWFIGRHGER AALGDWYLDK EKYPNGLEPV 
IKHVNDLDME FGLWVEPEMV SEESMLYRAH PDWVLALQGY HQPSGRWQYV LDLQNTACFN 
YLFERLNDLL TRYNISYLKW DMNRELVQPG HQGKPAVSGQ TNALYALLDK LLAVHTEVEI 
ESCSSGGGRI DFEILKRTHR FWPSDCNDAL ERQTIQRGMS YFFPPEVMGT HIGPEESHTT 
RRVHHINMRG MTALSGHMGV ELDPVKVPVE ERQAFAKYIA LHKQYRHLLH SGRSFRVDTA 
DNSQNIYGVH NNDEMLITVC QLTMPDYALP SPLRISCIDT TAQYQVNLVE TPENSFQLMK 
QRPKWLDKTL TLSGESLKEI GLSLPILDPE SALMLHLKKR