Gene Phep_4053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4053
Symbol
ID	8255187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	4897446
End bp	4898549
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	48%
IMG OID	644937717
Product	carboxylate-amine ligase
Protein accession	YP_003094306
Protein GI	255533934
COG category	[S] Function unknown
COG ID	[COG2170] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02050] uncharacterized enzyme

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00732082
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAACG ATTTTACCCT CGGTATAGAG GAAGAATATA TGGTAACAGA CCCTGTGACC 
AGGGAACTGA CCTCGCACGA CCAGAAGATA GTTGAAGCGG CACAAAAGAT ACATAAAGAC 
CAGGTAAAGG CCGAGATGCA CCAGGCGGTG GTAGAAGTGG GTACCGGAAT TTGCAGGAAT 
ACCGACCAGG CAAGGGCGGA AATTTCGCAG CTGCGCTATA CGGTTTCGCA ACTGGCCGGC 
GAGCTGGGAC TTAGGATTGG TGCTGCCGGT ACACATCCTT TTTCCCATTG GGAAAAACAG 
CTGATTACCG AACATCCCCG TTACAGCGAC ATTGTGAACG AGCTGCAGGA GGCCGCGCGC 
TCTAACCTGA TTTTTGGACT GCATGTACAT GTGGGCTTCC AGTCGCGCGA GCTGGCCATA 
CACATTGCTA ACCAGGTGCG CTATTTTTTA CCGCATGTTT TTGCCCTTTC AACCAATTCC 
CCCTTCTGGG AAGGGAGAAA TACAGGGTAC AAATCGTTCC GCACCAAGGT TTTTGACAAA 
TTTCCGCGAA CAGGCATTCC CGATATTTTT AACAGCATTG AAGATTATGA CAATTATGTA 
AAGCTGCTGA TCAAGACCAA CAGCATTGAC AATGCCAAAA AAATCTGGTG GGACATCAGG 
GTGCATCCTT TTTTTGAAAC CATAGAATTC AGGATCTGTG ATTGCCCCAT GCTGATCGAT 
GAAACCATGG CCTTTGTTGC CTTGTTTCAG TCCTTGTGCG CAAAACTGTA CAAGCTGCGC 
CTGCAAAACA TGAAGTTCAT CAGCTATTCC AGGGCACTGA TCAATGAGAA TAAATGGCGG 
GCCGCACGTT ATGGAATTGA TGGTAACCTG ATTGATTTTG GGAAAGAAAT GGAGGTAAAC 
TGTCGCAACC TGGTACTGGA GCTACTGGAT TTTGTGGACG ATGTAGTGGA CGACCTGGGT 
TGCCGCAGGG AGATCAATTA TGTAAGCCAG ATACTGGCCA ACGGAACTGG TGCCGACAGG 
CAATTGGCTG TTTACGAACA ATTTGGTAAC TTTGAGGCAG TGGTAGATTA CATTACCACG 
CAAACTTTAA TTGGGGCTAA ATAG

Protein sequence

MMNDFTLGIE EEYMVTDPVT RELTSHDQKI VEAAQKIHKD QVKAEMHQAV VEVGTGICRN 
TDQARAEISQ LRYTVSQLAG ELGLRIGAAG THPFSHWEKQ LITEHPRYSD IVNELQEAAR 
SNLIFGLHVH VGFQSRELAI HIANQVRYFL PHVFALSTNS PFWEGRNTGY KSFRTKVFDK 
FPRTGIPDIF NSIEDYDNYV KLLIKTNSID NAKKIWWDIR VHPFFETIEF RICDCPMLID 
ETMAFVALFQ SLCAKLYKLR LQNMKFISYS RALINENKWR AARYGIDGNL IDFGKEMEVN 
CRNLVLELLD FVDDVVDDLG CRREINYVSQ ILANGTGADR QLAVYEQFGN FEAVVDYITT 
QTLIGAK