Gene Phep_3541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3541
Symbol
ID	8254662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4214200
End bp	4215429
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	41%
IMG OID	644937192
Product	hypothetical protein
Protein accession	YP_003093794
Protein GI	255533422
COG category	[S] Function unknown
COG ID	[COG3876] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.383323
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.81555
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAT TTACTTCCTT ACTTTTTTTA ACGCTTCTGG CGATCAGCAA CATCAAATCT 
ACCGCACAAA TTGCATCGTC AAAGCAAGGT ACATCCAAAA AGTCGGGAAT TGTCACAGGT 
GCCGACCAGA CTGAAAAATA TTTGCCTTAT CTAAAAGGAA AACGAATTGG CCTGGTTGCA 
AATCAGAGTT CCATTATCGG CAAAAAAAGC AGCGTAGATA GTTTAAAGAG CCTTGGAATT 
AAAATTGTAA AAGTGTTTGG ACCTGAACAT GGTTTTAGGG GCAATGCCAG TAATGGAGCC 
GTGGTAAACA ACGAGATAGA TGCGAAAACC GGCATTCCCA TCATCTCTTT ATACGGCAAA 
AACGAGAAGC CAACAAAAGA ACAGCTGGCG GATATAGACC TTATGGTTTT TGATATTCAG 
GATGTGGGCT GTCGCTATTA TACCAATATT AATACACTTG AGTATGTGAT GGAAGCCTGT 
GCAGAAAACA ACAAAGAACT CCTGATTCTT GACAGACCTA ATCCTAATGC ATATGTAGTA 
GACGGCCCGG TAATGACTGA TGATAAATTT AAATCTGCCA TAGGGATTCA TTATACACCC 
ATGACGCATG GCATGACTAT CGGTGAGTTT GCACAATACC TTAACGGCGA GGGATACCTG 
AAAGAAAGAT GCAGCATAAA GATTATAAAA GTTGCCAACT ATAACCATGA CATGTCTTAT 
GTATTACCCA TACATCCTTC ACCAAATTTA AATACCCAGC AGGCTGTAAT GCTTTTCCCG 
AGCTTATGTA TGTTTGAGGG AACAGCGATC AATGAAGGTC GGGGAACTTA TATGCCATTT 
ACTATATTGG GAGCACCTGC ATTGAAAGGC AAGTATTCAT TTTCCTACAA ACCGGTAAGC 
ATTCCCGGAA TGAGTGAGCG GCCAAATCAC AAAGACTCCG TTTGCTATGG CCTTGACCTT 
CGCAATTATG ATATCAGCAA GCTTCGGAAG AGCCGCCAGA TTAATTTATC GTGGTTAATT 
GAATTGTACA ATGCTTATCC GGATAAAGCC CGCTTTTTTG GTCAGGAAAG AGCCAGTACA 
GGTGTATCTC CCTTTGATCT GCGTATAGGT ACCGATCAAT TAAGAAAACA GATCATAGCC 
GGAGTATCAG AAGCTGACAT CAGAAAAAGC TGGGAGCCTG GATTGCAGAA GTTTAAGGCT 
ATACGGGCGA AGTATCTCCT ATATCCGTAA

Protein sequence

MMKFTSLLFL TLLAISNIKS TAQIASSKQG TSKKSGIVTG ADQTEKYLPY LKGKRIGLVA 
NQSSIIGKKS SVDSLKSLGI KIVKVFGPEH GFRGNASNGA VVNNEIDAKT GIPIISLYGK 
NEKPTKEQLA DIDLMVFDIQ DVGCRYYTNI NTLEYVMEAC AENNKELLIL DRPNPNAYVV 
DGPVMTDDKF KSAIGIHYTP MTHGMTIGEF AQYLNGEGYL KERCSIKIIK VANYNHDMSY 
VLPIHPSPNL NTQQAVMLFP SLCMFEGTAI NEGRGTYMPF TILGAPALKG KYSFSYKPVS 
IPGMSERPNH KDSVCYGLDL RNYDISKLRK SRQINLSWLI ELYNAYPDKA RFFGQERAST 
GVSPFDLRIG TDQLRKQIIA GVSEADIRKS WEPGLQKFKA IRAKYLLYP