Gene Phep_1935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1935
Symbol
ID	8253039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2236334
End bp	2237494
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	43%
IMG OID	644935586
Product	hypothetical protein
Protein accession	YP_003092205
Protein GI	255531833
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0240984
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTTA CATTTTACAA AATCAACACA CAATTAATGG CCCTAAAGGC CATAACCTGT 
TTACTTTTAT CCATAGCTGG TTTAAGCGCT TCCGGACAAA ACAAGGCAGC GGGTAAAATC 
CATGTCGGTA TAATTTATCC TTTAAGCACC AATGGCAGCC ACGCGGCACT CGACACCAAT 
AACCTGTCTA TCCATCTGCT GGCAGGTATT TCGGCATCAG AACAGGGAGC TTCTTTTGCA 
GGTATTTCTA ATATCGTACG CAATGGGACC AAAGGATTTC AGTTTGCTGC CTTTTCAAAT 
CATATTGGTA AGCAGGTCGA AGGTGGCCTG TTCGCTGGCT TTTTAAATAC CTACGCAGGG 
GGCGATGCAT TTGCTGTCGC AGGTTTCAGC AATGTAGCTA CAGCTGACGT TAAAGGCGCG 
CAGTTCGCCG GCTTTGCCAA TGTATCCAAA AGCGTAAAAG GCGCACAGTT TGCCGGTTTT 
GCCAATATTG CTAAAACTGT AAAAGGGCCT CAGTTTGCAG GTTTTATCAA TTTATCTAAA 
AAAGATGCTG CCCTCCAGTT CGCAGGCTTT ATGAATAAAG CTACAGATGT TAAGGGCAGT 
CAGCTGGCTG GCTTTATCAA TATCGCAAAA AAAGTTAAAG GGGCCCAGAT AGCCGGCTTT 
ATCAATGTGG CCGACAGCAG CGATTATCCC ATCGGGATTA TCAATATTGT AAAAAATGGC 
GAAAAAGGCA TTGGCATTAG CACCGATGAA ACACTCACTA CAATGTTGTC TTTCAGGTCT 
GGTGGAAAAG TACTTTACGG CATTATCGGT ATAGGTTACA ATTTTAAAAA CACCGATGAA 
GTATATGCTT TTGAAGCTGG CCTGGGTGCA CACTTTTTCC AGTCGCCCAC TTTTCGCTTA 
AATGCAGAAA TTGCAGGTAC CGGACTAGAA AGTTTCAAGG CAGGCGAATA CTTCAAAACC 
TCGTTTAGGT TAATGCCCGC CTTCAAGATC AGTCCTAAAC TTGAAATCTT CGGCGGACCT 
TCAGTCAACT ATCTAAACAC CAATACGTTT GAAGGACGCA GCTTAAACAA AAGCTATATC 
AATACATGGG AAAACAAATG GGGCAATAAT TTCCAGGCCC TGTACATCGG TTATGGAGGC 
GGTATACAAT ACCTTTTTTA A

Protein sequence

MNFTFYKINT QLMALKAITC LLLSIAGLSA SGQNKAAGKI HVGIIYPLST NGSHAALDTN 
NLSIHLLAGI SASEQGASFA GISNIVRNGT KGFQFAAFSN HIGKQVEGGL FAGFLNTYAG 
GDAFAVAGFS NVATADVKGA QFAGFANVSK SVKGAQFAGF ANIAKTVKGP QFAGFINLSK 
KDAALQFAGF MNKATDVKGS QLAGFINIAK KVKGAQIAGF INVADSSDYP IGIINIVKNG 
EKGIGISTDE TLTTMLSFRS GGKVLYGIIG IGYNFKNTDE VYAFEAGLGA HFFQSPTFRL 
NAEIAGTGLE SFKAGEYFKT SFRLMPAFKI SPKLEIFGGP SVNYLNTNTF EGRSLNKSYI 
NTWENKWGNN FQALYIGYGG GIQYLF