Gene Phep_1867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1867
Symbol
ID	8252971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2156917
End bp	2157867
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	41%
IMG OID	644935518
Product	Mammalian cell entry related domain protein
Protein accession	YP_003092137
Protein GI	255531765
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.449047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATAG CAAACGAAAC TAAAGTAGGC ATCCTGGCGG CCTTTTCAAT TACCTTATTA 
ATTATTGGTT ATAACTTTTT AAAGGGTAAT GCCATTTTTT CGAATGAGAC CGTGCTGTAC 
GCCAGATACC CTAGGGTTGA TGGACTGGGC GTGTCCAAAC CAGTTCTGAT CAATGGTTTT 
CAGATTGGCC GCGTAGATAA GCTACAATTA CAATCAGATG GGAGTATCCT GGCCACTTTA 
AAGATCAAGG GAAAATATGA AATCCCAAAA AACAGTATAG CTAAACTGGA AGGTACCGAC 
CTGCTGGGCA GTAAAGCTAT TGTAATGGAA CTGGGCACGG GTCAGGATTT TGCGCAGGAT 
GGGGATACCC TTAATGCAAA TGTGGCTAAG GGTCTGCTTG AAACCGTACA GCCGGTTCAG 
AAAAAAGCTG AACTGATCAT CACTAAAATG GATTCGATCC TGACAAGCGT AAACTCTATC 
CTAAACCCTA ACTTTCAAAA GAATGTTGAT AAAAGTTTTA ACAGCATAGC TTCTACGCTT 
TCTTCATTGG AAGCTACATC TAAAAAGGTA GATAATCTGG TGGGCTCTGA AGGGTCCAGG 
GTATCTGCAA TCCTGGCCAA TGTAGAGGCC ATTTCAAGTA ACCTGAAAAA GAACAATGAA 
AAGATAAACG GCATATTGAA TAACATTGGC AATATCACAG ATCAGGTGGC TGCAGCTAAT 
TTTAAACAGA CCATAGAGAA TGCCAATAAG GCCATGGCCG ATCTGCAGAC CATTGTTAAT 
AAGGTGAACA ACGGACAAGG AACCCTGGGT ATGCTGGTGA ATGATACAAA AATGTATGAA 
AACCTGAACA ATGCCTCTAA AAACCTGGAT AACCTGATGA TAGACCTGAA ACAAAATCCT 
AAACGTTACG TTCACTTCTC CGTATTCGGA GGTGGTAAAA AGGATAACTA A

Protein sequence

MKIANETKVG ILAAFSITLL IIGYNFLKGN AIFSNETVLY ARYPRVDGLG VSKPVLINGF 
QIGRVDKLQL QSDGSILATL KIKGKYEIPK NSIAKLEGTD LLGSKAIVME LGTGQDFAQD 
GDTLNANVAK GLLETVQPVQ KKAELIITKM DSILTSVNSI LNPNFQKNVD KSFNSIASTL 
SSLEATSKKV DNLVGSEGSR VSAILANVEA ISSNLKKNNE KINGILNNIG NITDQVAAAN 
FKQTIENANK AMADLQTIVN KVNNGQGTLG MLVNDTKMYE NLNNASKNLD NLMIDLKQNP 
KRYVHFSVFG GGKKDN