Gene CPS_4148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPS_4148
Symbol	mutY
ID	3522464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Colwellia psychrerythraea 34H
Kingdom	Bacteria
Replicon accession	NC_003910
Strand	+
Start bp	4362430
End bp	4363518
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	39%
IMG OID	637286591
Product	A/G-specific adenine glycosylase
Protein accession	YP_270802
Protein GI	71281992
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.220216
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATC CTATAGTAAT ATCAGCCAAA TCGGCTGAAC AATTTGGCCA GCAAGTCGTA 
AGCTGGTATC ACCTACAAGG TAGAAAGCAC TTACCTTGGC AACAAGATAA AACCCCATAT 
AGAGTGTGGA TTTCAGAGAT AATGTTACAA CAAACACAAG TTGCGACAGT TATCCCTTAC 
TATCAACGTT TTATGGAAAG TTTTCCGACA ATTACCGACT TAGCCAATGC TGATGAAGAT 
GTGGTTTTAC ATCATTGGAC TGGTTTAGGC TATTATGCTC GAGCTCGTAA TTTACATAAA 
TCAGCTAAAA TCATGCTCAA TGACTATGAT GGCCATTTTC CCATTGAAAT TGAGCAAGTT 
ATCGCTTTAC CTGGCATAGG TCGCTCGACC GCTGGCGCTA TTTTAAGTTT ATCGTTAAAA 
CAATATCATC CTATTTTAGA CGGTAATGTA AAACGGGTGC TGGCACGAAG TTACCTTGTT 
GAAGGTTATA ATGGCTTAAG TAAATTCGAT AAAGCGTTAT GGCAATTAAG TGAGAAATTA 
ACGCCTGCCA TTGAAACCGA TAGTTTTAAT CAAGCGATGA TGGATCTTGG GGCAACTGTG 
TGTACTCGTA GTAAACCAAG CTGTGATATA TGCCCCGTTG AGCAAAGTTG CCTAGCCAAA 
GCGGGTGATC AGCAAATGAA TTTTCCTCAG AAAAAACCTA AGAAAAAAAT TCCTGAAAAA 
CAAACAATCA TGGTGATCCC AAGATTGAAA AACGAAAACT GCGATAAAGT TTTAATGGAA 
AAGCGTCCTC CTGTTGGTAT TTGGGGCGGC TTATGGTGTT TTCATGAGGT TGATGAGCTA 
AGCGAAATTA ATGACTTAAT GACGAGTTTG TCACTTAAGG AAATTTCATC ACAAACCCTA 
ACTGAGTTTA GGCACACTTT CAGTCATTTT CATTTAGATA TTACTCCCGT GGTAGTAGAC 
TGCCAGCAAC TTGAAGTTTC AAAAATAAAC GAACCTAATC AGCAAAAGTG GTATGATTTA 
CACCAAGGAT TGAGTGTCGG CCTAGCGGCT TCCACACAAA AACTACTTAC TTTGCTTAGA 
GACTGTTAA

Protein sequence

MNNPIVISAK SAEQFGQQVV SWYHLQGRKH LPWQQDKTPY RVWISEIMLQ QTQVATVIPY 
YQRFMESFPT ITDLANADED VVLHHWTGLG YYARARNLHK SAKIMLNDYD GHFPIEIEQV 
IALPGIGRST AGAILSLSLK QYHPILDGNV KRVLARSYLV EGYNGLSKFD KALWQLSEKL 
TPAIETDSFN QAMMDLGATV CTRSKPSCDI CPVEQSCLAK AGDQQMNFPQ KKPKKKIPEK 
QTIMVIPRLK NENCDKVLME KRPPVGIWGG LWCFHEVDEL SEINDLMTSL SLKEISSQTL 
TEFRHTFSHF HLDITPVVVD CQQLEVSKIN EPNQQKWYDL HQGLSVGLAA STQKLLTLLR 
DC