Gene Tery_4279 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4279
Symbol
ID	4245931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6600206
End bp	6601207
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	40%
IMG OID	638109171
Product	UDP-galactose 4-epimerase
Protein accession	YP_723749
Protein GI	113477688
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.277879
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0248708
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCACAAA CCAAGCCAAC GATTTTAGTG AGTGGGGGAG CAGGATATAT TGGTTCCCAT 
GCAGTTCAGG CTTTACAAAA TGCAGGTTAT GATATAGTGA TTTTGGATAA CCTCGTCTAT 
GGACATCGGG ACATTGTAGA AAATGTCCTG AAGGTAGAAA TGATTGTTGG GGATACTAGC 
GATCGCTCTT TATTAGATAA AATTTTTGCT ACTCACAACA TTGCTGCAGT AATGCATTTT 
GCAGCATATA TTTTTGTCGG TGAATCAGTA AAGGATCCGC AGAAATATTA CCACAATAAT 
GTAGTTGGGA CACTAACATT ATTAGAAGCG ATGCTTAAAG CATCCATAAA AAAGTTTGTT 
TTCTCTTCAA CTGCTGCTAT TTATGGGAAA CCACAAACCA TTCCTATTCC CGAGGATCAT 
CCGAAAAATC CAATTAACCC TTATGGTGCA AGTAAGCGGA TGATAGAGCA AATACTTGCA 
GATTTTGAGA TCGCTTATGA TTTTAAGTCG GTTTGTTTTC GCTACTTTAA TGCAGCAGGA 
GCACATCCTA ATGGTTTGAC TGGGGAAGAT CATAACCCGG AAACTCATTT AATTCCTCTG 
GTATTGTTTG CAGCATTGGG CAAGCGAGAT TCTATATCAA TTTTTGGCAC AAATTATAAG 
ACTCCTGATG GTACTTGTAT TCGAGATTAT ATTCATGTGT GTGATTTAGC GGATGCTCAT 
GTTTTGGGGT TAGAATATTT GTTGAATGGT GGTGAGAGCA ATATTTTTAA TTTGGGCAAT 
GGTAATGGGT TTTCGGTTAG GGAAGTGATA GAGACTGTGA AGCAAGTAAC TGGTAGAGAG 
TTTAAAGTGG AGGAGCGCGA TCGCCGACCT GGAGATCCAC CTATTTTGGT AGGGAGTAGT 
GAGAAAGCCA GGAAAGTGTT GGGTTGGTCT CCGAAATATC CAGAGGTTAA GGAAATAGTT 
AGTCATGCTT GGCAGTGGCA TCAAAAACGA CATGGGAAAT GA

Protein sequence

MSQTKPTILV SGGAGYIGSH AVQALQNAGY DIVILDNLVY GHRDIVENVL KVEMIVGDTS 
DRSLLDKIFA THNIAAVMHF AAYIFVGESV KDPQKYYHNN VVGTLTLLEA MLKASIKKFV 
FSSTAAIYGK PQTIPIPEDH PKNPINPYGA SKRMIEQILA DFEIAYDFKS VCFRYFNAAG 
AHPNGLTGED HNPETHLIPL VLFAALGKRD SISIFGTNYK TPDGTCIRDY IHVCDLADAH 
VLGLEYLLNG GESNIFNLGN GNGFSVREVI ETVKQVTGRE FKVEERDRRP GDPPILVGSS 
EKARKVLGWS PKYPEVKEIV SHAWQWHQKR HGK