Gene Oant_3467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oant_3467
Symbol
ID	5381447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ochrobactrum anthropi ATCC 49188
Kingdom	Bacteria
Replicon accession	NC_009668
Strand	-
Start bp	825542
End bp	826720
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	55%
IMG OID	640836149
Product	ectoine utilization protein EutD
Protein accession	YP_001372002
Protein GI	153010788
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID	[TIGR02993] ectoine utilization protein EutD

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGTGG AACTCAACTT CACCCGCGCG GAATATGATG AGCGGATAGC CAAAACCCGT 
CGCGCCATGG AGAAGGCAGG CTTCGATGTC ATCATCGTCA CAGACCCGTC CAACATACAC 
TGGCTTACCG GTTATGATGG CTGGTCCTTC TATGTCCATC AATGCGTTGT GCTTTCGATG 
GAAGGCGAAC CGATCTGGTA CGGTCGCGGT CAGGATGGCA ACGGTGCGAA ACGCACCGCG 
TGGATAAGCC ATGACAACAT CATCGGCTAT CCTGACCACT ACGTGCAATC GCTGGAACGC 
CACCCGATGG ATCTTCTGGC CTCAACCCTT GAGGAAAAGG GTTGGGGTAA CAAGACGATA 
GCCGTCGAGT TCGACAATTA CTGGTACACT GCTGCGGCCC ACCATGCTTT GCAGAAGCAT 
CTGCCCAATG CACAGTTCAA AGATGCGCAA GGTCTCGTCA ACTGGCAGCG GGCGGTGAAG 
AGTTCAACCG AGATTGGCTA TATGCGCAAA GCCGGGCGCA TCGTGGAAGC CATGCACCAG 
CGCATCGTCG ATAAAATCGA GCCGGGTATG CGTAAATGCG ATCTGGTTGC AGAAATCTAT 
GATGCAGGCA CACGCGGCGT TGACGATTTC GGCGGCGATT ATCCTGCCAT TGTGCCGTTG 
CTGCCTTCTG GACCTGACGC CTCCGCCCCG CATCTCACCT GGAACGATTT GCCGATGAAG 
ACCGGAGAAG GCACCTTCTT CGAGATTGCA GGTTGCTATA AGCGTTATCA TTGCCCACTG 
TCGCGGACTG TATTTCTCGG CAAGCCGACG CAGGCTTTTC TTGATGCAGA AAAAGCAACA 
CTCGAAGGTA TGGAAGCGGG ACTTGCTGCT GCTCGTCCCG GCAATACCTG CGAAGATATT 
GCCAACGGCT TCTTCGCTGT TTTGAAGAAA TACGGGATCA TCAAGGACAA CCGCACCGGC 
TATTCCATCG GCCTGTCCTA TCCGCCGGAT TGGGGCGAAC GCACCATGAG CCTGCGCCCC 
GGCGATCACA CCGAATTGCA GCCCGGCATG ACCTTTCACT TCATGACAGG TCTCTGGCTG 
GAAACCATGG GGCTGGAGAT CACCGAGAGC ATCGTGATCA CCGAAACCGG CGTCGAATGC 
CTGTCGAATG TGCCACGCAA GCTCGTGGTC AAGAATTAG

Protein sequence

MSVELNFTRA EYDERIAKTR RAMEKAGFDV IIVTDPSNIH WLTGYDGWSF YVHQCVVLSM 
EGEPIWYGRG QDGNGAKRTA WISHDNIIGY PDHYVQSLER HPMDLLASTL EEKGWGNKTI 
AVEFDNYWYT AAAHHALQKH LPNAQFKDAQ GLVNWQRAVK SSTEIGYMRK AGRIVEAMHQ 
RIVDKIEPGM RKCDLVAEIY DAGTRGVDDF GGDYPAIVPL LPSGPDASAP HLTWNDLPMK 
TGEGTFFEIA GCYKRYHCPL SRTVFLGKPT QAFLDAEKAT LEGMEAGLAA ARPGNTCEDI 
ANGFFAVLKK YGIIKDNRTG YSIGLSYPPD WGERTMSLRP GDHTELQPGM TFHFMTGLWL 
ETMGLEITES IVITETGVEC LSNVPRKLVV KN