Gene Phep_3051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3051
Symbol
ID	8254167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3646997
End bp	3648217
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	43%
IMG OID	644936704
Product	hypothetical protein
Protein accession	YP_003093311
Protein GI	255532939
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0036392
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0164815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAAGA ACTTTATCGC TAAGCCCCTG CTGATGTGTT TGGTACTGGT TGCTGTTCTG 
CTGGTAAGTG CCTGTAACCG CAAAAAAGTA AAGCATGATG CAGCTGACGA TCCTGCCATT 
GTAAAAATAG ACAGTAACCT GTCTCATTTG TTAAAACCTT CAAATGAGCA GGTGGTAGCC 
AAATTACCTG TAATTAAGGC CGATTATGGT ACAAAGATAT TTACTGAGGA AGTACAGGGC 
CTGGTAAATT ACGATACCCG TAATGAAAAA AGCATTGCCA GCAGGGTAAG TGGCAGGATA 
GAACGTTTAC TGATCAAATA CAATTATCAG CCGGTTAAAA AGGGACAGTT GATTATGGAA 
GTTTATTCGC CTGATCTCGC TGCAGCACAG CAGGAACTGT TGTTTTTGAA AAACTCAGAA 
AAAGATCCGG CCCTGTTAAA TAGCGCTATA CAACGCTTAA TGCTTTTGGG AATGAATGCT 
GCTGCGGTCA ATCAGCTACT GAAAACAGGA AAGATAAATT ACCGCATTCC GGTATACAGC 
CATGCAAATG GTTATATACT GGAAAAAAAT GCTGCTCCGG TTGTTGCTGC CCCATCCCCG 
ACTGGGGGAA GTAACGGATC TTCAGATAGG ATGGCTGGAA TGGGTAGCGC CGCTTCAACA 
ACTGGTGCTA CCATTAGTAG ACCATCAACC CCGGCCAGTA CCCCTCTGCT ATTGCGTGAA 
GGACAATATG TAAGTGCGGG ACAATCACTA TTTACTATTT ACAATGCTGA TCGCCTGGTG 
GCCGAATTTT CGTTGAAGCC TGCATTGGCT GCATTGCTAA AAAAGGGGCA CCGGTTTGTA 
TTTTATAAAA ACAACGAAAA AAATAATATG GAGACGGGAG CCATTGGCTT AATCCAACCT 
GTATTTAAAG ACGGAGATAA TTTTACCATT GCCCGGGTGT ACCTGCATAA GCCCAGTTTC 
AGGGTAGGCG AATTGCTGAC TGCAAGAATC CCTGTATTGC TACCAAAATC ATGGTGGCTG 
CCGGAATCAG CCCTGGTATC TTTAGGAAAT AAAAGAATCG TATTTAAAAA AGAAGGCAAT 
GTTTTTATCC CTAAACAGGT TGATGCCGGG ATCACCATTG GAGGGATGGT ACAGGTTAAA 
ACCGATATCA GTAACTGGCC TATCAGTAAA AATGCAGCTT ATCTGGTAGA CAGTGAAAGC 
TTTATAAAAA TATCACAATA G

Protein sequence

MRKNFIAKPL LMCLVLVAVL LVSACNRKKV KHDAADDPAI VKIDSNLSHL LKPSNEQVVA 
KLPVIKADYG TKIFTEEVQG LVNYDTRNEK SIASRVSGRI ERLLIKYNYQ PVKKGQLIME 
VYSPDLAAAQ QELLFLKNSE KDPALLNSAI QRLMLLGMNA AAVNQLLKTG KINYRIPVYS 
HANGYILEKN AAPVVAAPSP TGGSNGSSDR MAGMGSAAST TGATISRPST PASTPLLLRE 
GQYVSAGQSL FTIYNADRLV AEFSLKPALA ALLKKGHRFV FYKNNEKNNM ETGAIGLIQP 
VFKDGDNFTI ARVYLHKPSF RVGELLTARI PVLLPKSWWL PESALVSLGN KRIVFKKEGN 
VFIPKQVDAG ITIGGMVQVK TDISNWPISK NAAYLVDSES FIKISQ