Gene Phep_3569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3569
Symbol
ID	8254691
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4247443
End bp	4248513
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	44%
IMG OID	644937221
Product	Kelch repeat-containing protein
Protein accession	YP_003093822
Protein GI	255533450
COG category	[S] Function unknown
COG ID	[COG3055] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03548] cyclically-permuted mutatrotase family protein

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.396021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.14422
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTGC TATCTATTTA TTTATTCTTA TTGGGAAATA TAATGTTGAC TACTATAAAT 
TCAAAAGCCC AGGTTATGCC GGTGTTCAGT GAGCTTACAT CTTTACCCGA TTCCGAGGGC 
TATGCAGGAA TGTTTGCCGG GGTTAGCAAT GGAAGGTTAT TTTGCCTTGG CGGTGCCAAT 
TTTCCTGATA AACGACCCTG GGAAGGCGGT AAAAAGAAGT GGTATGATGA AATCTACATG 
TTTCAGGAAG GCAAGGACTG GGTAAAGCTG GCTGATAAAC TACCATCTCC ACTTGGTTAT 
GGAATAACTG TCAGCTATAA AAATCAATTT ATAATTGTGG GTGGTAACCA TGCAGCAGGA 
TTTTCGGACA AAGTATATGG ATATGAATGG ACGGATGGCA GATTAAAAAT GGTCCATTAT 
CCGCAATTGC CTGTTCCCCT AGCCAATATG GCAGGAACAC TTGTTGGCCA GCTAATCATC 
CTTGCCGGGG GGAATAGCTC TGCTACAGGC AGGGCAGGTA AACAGTGTTA TGTGCTGGAT 
CTTGAAGCGA TTGACAGTGG ATGGTCTGCA TTGCCATCCT GGCCAGGAAG GGAACGGATG 
TTACCTCTAT GTGCTGTGTA TGGTGGTATG TTTTATTTGT TTGGCGGAGA AACTACTGGG 
ATTAATTCCT TAAGTCAACA TTACCGGCTT ATCCTGGATG ATGCCTACAG CTTTAAACCA 
AAAAAGGTGG ATGGAAGATG GACCGGGACC TGGACTACAC TTTCTCGTAT GCCTAAAGGG 
CTGTCAGCCG GTGGTAGTCC ATTACCCGTA TTGGAAAATG GTGACGTAGT GTTTTGGGGT 
GGTGTTGATG CGTTAACCTC TTTGCATACT GATCCGCTTT CACATCCTGG AATATCGGCC 
GATGTGCAGT TGTATAACCT TAATAGCGAT ACCTGGAAAT ATGCAGGTAA AAAACTGGGA 
ATTGCTGCTC CTGTTACTTT GCCTGTTGTA AACTGGAACG GGCGATGGCT TTACATTAGC 
GGGGAAATAA AACCTGGGAT AAGGACCAAT AAAATTTATG AGTTGAAATA G

Protein sequence

MKLLSIYLFL LGNIMLTTIN SKAQVMPVFS ELTSLPDSEG YAGMFAGVSN GRLFCLGGAN 
FPDKRPWEGG KKKWYDEIYM FQEGKDWVKL ADKLPSPLGY GITVSYKNQF IIVGGNHAAG 
FSDKVYGYEW TDGRLKMVHY PQLPVPLANM AGTLVGQLII LAGGNSSATG RAGKQCYVLD 
LEAIDSGWSA LPSWPGRERM LPLCAVYGGM FYLFGGETTG INSLSQHYRL ILDDAYSFKP 
KKVDGRWTGT WTTLSRMPKG LSAGGSPLPV LENGDVVFWG GVDALTSLHT DPLSHPGISA 
DVQLYNLNSD TWKYAGKKLG IAAPVTLPVV NWNGRWLYIS GEIKPGIRTN KIYELK