Gene Phep_3366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3366
Symbol
ID	8254485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3994458
End bp	3996059
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	43%
IMG OID	644937018
Product	hypothetical protein
Protein accession	YP_003093622
Protein GI	255533250
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAAC AAATTATAAT TATAGCGCTT ATAGCGTTTG GCTTATTGTC TTGTACCAAA 
AATTTTGAAG AAATCAATAC AGATCCGAAC AAACCTGTGA AAGTGCAACC GGATTTTTTA 
CTGACCACTT CCATTTTTGA AACAATGAAC CTGTTTGGCG GCAATATGAA CCGTGTGGTA 
TTTTTTAACT ATACACACCA TTTCTCTGGC TTTCAGGGTA ATTTTCAGCG CTACAACTAC 
GACCTGAACG AGGACAATAC TTATTGGCGC GCAGTTTATG TACAAGCCGC CCAACCTGTA 
AACCAGATTA TTGTAAATTA TAAAAATGAT CCTGCTTATA CCAACAGGGT GATGATTGCG 
CGCATATGGA AAAATTATAT CCTATCCAAT GCAGTGGTGA TATGGGGAAG TGTTCCTACG 
GAAGGTGCCT TGCTGGGTAC GCCAAGTGTT CCTTATACCA AAGAACAGGA TGTATATGTG 
AACGTATTGG CTGATCTTAA AAATTTAACG GATTCATTAA GCCTTACCGG TGATAAATAT 
ACTGTAAATG CAGATAAGAT TTTTGGCGGT GACCTTTTAA AATGGAAGAA ATTTGCAAAT 
ACACTGAGGT TAAGACTGGC CATCCGGATT TCTAACGATG CGCCCAATGG CGATCCTGTG 
TTAGCCAAAA GGGTAGTAGA AGAAGTTTTT CAAACGGAAC AGTATACGAT GAAGGCCCAG 
ACTGAAACGG CTGCGGCAAA CTGGGGCACA ACCAGTGATA CCTGGAGTCC GCTTTACGAC 
AGGGCGGTAT ACAATTATAC TGCCAACAAG GCCACTATTC CGGTTACCAA TGAGTCGCTG 
GTTTACCACA TGGCGCCTTA CAACGATGCA CGGTTAACTA TATATGCACA GCCGGCGAAA 
CAAGGCCCGC AAACCGGAAC TTACTTTGGA CAGAACATCT CTTATGGAGG GGGATCAACT 
TATGCTAACG GTTTAACCAA TCCGCATACC GGCTTAAAAC AAGATGACTA TTCGGCTATA 
GGTGAGCGGT TTTTAAAGCC CGATGCGGAA TATGTGTTCC TTTCATATGC TGAAGCTTGT 
TTTTTAAAGG CGGAAGCTGC GTTAAAGGGA TGGTGGGGCA ACCCAAATGC TTCGCAGTAT 
TATTATGAAG GTATAGATGC TTCTTTTAAC AGGTATGGCC TTACTGTAAC ACAGGCAAGC 
AATTATAAAA ATACACCCGG CATTAAGTGG AGTACGGCAT CTGATACCGT TGGCAGGAGC 
GCCCAATTTA AAGACTGGTT GCAGATCTGT TCCAGTTATA TTCCTGCAGG TGATAATTTG 
CGTCAGATTG TGATGCAACA TTGGCTGGCC ATCCCGGGGC AGGGCGTAGA TGCCTGGACA 
CTGATCAGAA GGACCAGGTT GCTTGAATTT CAGCCGCAAT TTGCTACCTA TGATGGTACT 
TACGCCTATG TGCCTAACCG TTTGCCATAT CCCTCAGATG AATTGCAGAC CAATATTGGA 
GAAGTAAATA AAGCCATTGG CTGGCTGGGC GGTGCCGATA ACCTTAACAC GAAGTTATGG 
TTTGCGTTGC CCGTTAAGAA AAATCCTTTT TTACCATTTT AA

Protein sequence

MKQQIIIIAL IAFGLLSCTK NFEEINTDPN KPVKVQPDFL LTTSIFETMN LFGGNMNRVV 
FFNYTHHFSG FQGNFQRYNY DLNEDNTYWR AVYVQAAQPV NQIIVNYKND PAYTNRVMIA 
RIWKNYILSN AVVIWGSVPT EGALLGTPSV PYTKEQDVYV NVLADLKNLT DSLSLTGDKY 
TVNADKIFGG DLLKWKKFAN TLRLRLAIRI SNDAPNGDPV LAKRVVEEVF QTEQYTMKAQ 
TETAAANWGT TSDTWSPLYD RAVYNYTANK ATIPVTNESL VYHMAPYNDA RLTIYAQPAK 
QGPQTGTYFG QNISYGGGST YANGLTNPHT GLKQDDYSAI GERFLKPDAE YVFLSYAEAC 
FLKAEAALKG WWGNPNASQY YYEGIDASFN RYGLTVTQAS NYKNTPGIKW STASDTVGRS 
AQFKDWLQIC SSYIPAGDNL RQIVMQHWLA IPGQGVDAWT LIRRTRLLEF QPQFATYDGT 
YAYVPNRLPY PSDELQTNIG EVNKAIGWLG GADNLNTKLW FALPVKKNPF LPF