Gene A9601_14271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_14271
Symbol	galE
ID	4718148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1199934
End bp	1201001
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	29%
IMG OID	640079148
Product	UDP-glucose 4-epimerase
Protein accession	YP_001009818
Protein GI	123968960
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACTG TTCTTACCAC AGGAGGACTT GGATATATAG GAAGTCACAC GGTAATTGCA 
CTTATAAATC GGGGTTTTAA TGTTTTGATT ATTGATTCAT TAATAAATTC TAAGTCGGAA 
ACGTTTAATA ATATTGAAAA AATTTTATTT AATGAGATGG GTGAAATTAA AGAAAAATTA 
TTTTTTAGGA AAGGAGATTT AAGGAACAAA TTATGGCTTG AAAATATTTT TCAGGAATTT 
AATGATAAAA AACAACCTAT CGAGGCCGTC ATTCACTTCG CAGGTTTAAA ATCTATAGGA 
GAATCTATAT TAAATCCCTT AAATTACTAT GATGTAAATC TCAACACTAC TTTATGTCTC 
CTTTCAGTAA TGTCTAAATT TAAATGCTTT AAATTGATAT TTAGTAGTAG CGCAACTGTT 
TATAAAATTG ATAAAAATGA AAAGATATCA GAAAATGGAA TCCTTTCACC TCTTAATCCA 
TATGGAAATA CAAAATTAAG TAACGAAAAA ATAATCGAAG ACGTTTTTAA AAGCGACGAT 
AAAAGATGGA AAATAGCTAA CTTGAGGTAT TTCAATCCTT GTGGAGCTCA TGATTCAGGA 
ATAATTGGAG AAAATCCCTT AATAAATCAT TCAAATATAT TTCCTACAAT TTTAAGGGTA 
ATTAATAGAG AGATTGAAAA ACTTCCTATT TACGGATCCG ATTGGCCTAC TAAAGATGGG 
ACATGTATTA GAGACTATAT TCATGTAATG GATTTAGCAG AAGCTCATTT AGCTGCACTT 
ATTTATTTAT ATGAAAATGA GCCGACTTAC CTTAATCTCA ATATTGGAAC GGGTACAGGT 
ATAAGTGTAC TAGAACTTAT TAAGACCTTT AGCAATGTAA ATAATTGTCA AATTCCATAT 
TACTTTACTG AAAAAAGAAA AGGTGATGCT GCTTTCGTTG TTGCGAATAA TTCTTTAGTT 
ATTCAAACTT TAAAGTGGGA ACCTAAGAGA AACCTAAAAG ATATTTGCAA AGACTCATGG 
CGTTGGTTTA TCAAAAGTAA AGAAGGAAGT AATTTTAAAA ATAATTGA

Protein sequence

MKTVLTTGGL GYIGSHTVIA LINRGFNVLI IDSLINSKSE TFNNIEKILF NEMGEIKEKL 
FFRKGDLRNK LWLENIFQEF NDKKQPIEAV IHFAGLKSIG ESILNPLNYY DVNLNTTLCL 
LSVMSKFKCF KLIFSSSATV YKIDKNEKIS ENGILSPLNP YGNTKLSNEK IIEDVFKSDD 
KRWKIANLRY FNPCGAHDSG IIGENPLINH SNIFPTILRV INREIEKLPI YGSDWPTKDG 
TCIRDYIHVM DLAEAHLAAL IYLYENEPTY LNLNIGTGTG ISVLELIKTF SNVNNCQIPY 
YFTEKRKGDA AFVVANNSLV IQTLKWEPKR NLKDICKDSW RWFIKSKEGS NFKNN