Gene Phep_3404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3404
Symbol
ID	8254523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4051749
End bp	4052984
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	45%
IMG OID	644937056
Product	domain of unknown function DUF1735
Protein accession	YP_003093660
Protein GI	255533288
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00777972
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAGCTA CTCATAAAAC CAACAACATG AAAAAAATTA AATTAGCTGC GTCGATAGGC 
ATTTTAATGA TGCTGGCAGC ATGTAGTAAA GACGTCAAAG TTGATCTGGA TCTTCCTAAA 
GCAGAGCAGT TGAAAAAGGT ATATATGCCG CAAGCTGCCA ACCCGGTTGA AGTCCGTTCT 
GTAAGTATTG TCGATAAGGA CACCTCCTTT GTATATAGTG CATTTCTTGG GGGCCCCAAA 
CCAGCAACCG GTAACATTAC AGTAGGTTTT ACTGTCATGC CGGAAAAAGT TACGGCTTAC 
AATCAGCAAA ACAGTACCAA TTATCAGCTT ATGCCTCAGG GTAGTTATGT GCTCGAGGCC 
CTTACTTCCG TTATTCCGGC TGGTGGGCAG TCAACAGGCA GGTTAAACCT GTCGATCAAA 
ACAAAAGGCT TTTTAAATCC TTTTGAAACT TATCTCTTGC CTGTTACCGT GACTAAGCAA 
ACCGGAGAAG GAACGCTGAA CGAAAGTCTG GCCACCACTT ATTACCTGAT TGCGGGTTCT 
TATGCACCGG GCGAGGTGCC GCGTGAAAAA ACGCTTGCCT TGGGTACTGC AGGCGTTGGA 
AACATCATGC TTGATTTTGA TGGAAAGCTG ATCATAAAAA ATGCTGATGG CAACTTATTG 
CTTTATCCGG TAAATGTAAA CGGCACCTTT GGTACACCAG CACAAATTGG TGTGGGATGG 
AACATTTTCA ATATGATCTT TTATTTCGGT GGCGACCGGC TGATTGCCAG ATGGGCAAGC 
GGCGGACAGG ACATCAGCCA ATATGCCATA AGCAAATCGG GAGCTTTCGG CGGCAGTAAA 
TCGATCGGTC AGGGCTGGGG GATATTTACT AAAATCATTC CGTTCAAAGG GCTTTTACTT 
GGCGTAGACG GCGCTGGCGA TATGACCATG TATCCCCTGG ATGTTGCCGG CAACTTTGAT 
TTTGGCAGAA TTAAAAAAAT CGGTACCAAA TGGAACGATT ACAAACAGGT TTTCGCTTAC 
CAAAATTCCC TGATCGCGAT TGAGCCAGGT GGAGATATGT ACCAGATCCC TTTATCAGAC 
AGCGGTGTAT TTGGCTCCAG AAGAAAAGTG GGTAATGGCT GGGATATGTA TGTAAATGTA 
TTCGCATCTG GTGACGACCT GTTAGCGCTG GATAGCAACG GCGACTTATG GCGCTACCGC 
TTCAACCCAA TCGGTTTCTG GCCCTTAAAG AAATAG

Protein sequence

MVATHKTNNM KKIKLAASIG ILMMLAACSK DVKVDLDLPK AEQLKKVYMP QAANPVEVRS 
VSIVDKDTSF VYSAFLGGPK PATGNITVGF TVMPEKVTAY NQQNSTNYQL MPQGSYVLEA 
LTSVIPAGGQ STGRLNLSIK TKGFLNPFET YLLPVTVTKQ TGEGTLNESL ATTYYLIAGS 
YAPGEVPREK TLALGTAGVG NIMLDFDGKL IIKNADGNLL LYPVNVNGTF GTPAQIGVGW 
NIFNMIFYFG GDRLIARWAS GGQDISQYAI SKSGAFGGSK SIGQGWGIFT KIIPFKGLLL 
GVDGAGDMTM YPLDVAGNFD FGRIKKIGTK WNDYKQVFAY QNSLIAIEPG GDMYQIPLSD 
SGVFGSRRKV GNGWDMYVNV FASGDDLLAL DSNGDLWRYR FNPIGFWPLK K