Gene Acid345_4508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4508
Symbol
ID	4070186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5349581
End bp	5350606
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	59%
IMG OID	637986547
Product	aldo/keto reductase
Protein accession	YP_593582
Protein GI	94971534
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.532493
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.56936
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG AGCAAAAGAA CCGCGAATTG GATCGGCGTG AGTTCCTCGG GATCTCCGTC 
GGAGCAGCGA TGCTGTTCGG CATGAATGGC TATCCAGGTC TCGCGCAAGA CAAGACCGGT 
GTGCAATACC GTACCCTCGG CCACACCGGC GAACGTGTCT CGTGCATCGG CCTCGGTGGA 
TACCACATCG GCATCCAAGG CTCGGAAGAC GAGAGCATCC GCATCATTCG TCGAGCGATC 
GATGGCGGCA TCAACTTCCT CGACAACTGC TGGGACTACA ACGACGGTGG CAGCGAAGTC 
CGCATGGGCA AGGCCCTGCG CGATGGCTAT CGCAAGCGTG CCTTCCTAAT GACCAAAATT 
GACGGGCACG ACGGTAAGAC CGCGACGAAA CAACTCGAAG ACTCCCTCCG TCGCCTCCAG 
ACGGATCACC TCGACTTGTT GCAATTCCAC GAAGTCATTC GGCCCACCGA TCCCGACAGG 
ATCTTTGCCG CCAACGGCTC ATTCGAAGCG ATGCAGAAGG CCAAGCAGGC TGGAAAGATT 
CGTTACCTTG GCTACACCGG CCACAAGGAT CCCGAGATCC ACCTGAAGAT GTTGAGCACG 
GCGCTCGCGC ACAATTGGAC GCCCGACTCC GTCCAAATGC CGCTGAACGT CATGGACACA 
CACTTCAACA GCTTCGAACA CAAAGTCCTG CCCGAACTGG TGAAGCACAA CATCGGCGTG 
CTCGGTATGA AGCCCATGGG CAGTGGCGTC ATCCTGCAGA GCAAGGTCGT CACGCCCGTC 
GAGTGCCTGA CCTATGCACT CAGCTTGCCG ACCAGCGTCG TCATCACTGG TTGCGATTCC 
ATGCAAGTCG TCGATCAGGC GCTGAAGGTC GCGCGTGAGT TCAAGCCGCC CAGCGAAAAA 
GAAGTCGCAG CTCTTCGCGC GAAAACCGCA CCGGTTGCGA TGGCAGGGAA GTACGAGCTC 
TACAAGACTT CGAGCAATTT CGACGGCACC GCTCACAACC CGCAGTGGCT CGGCGGGGCA 
CCTTAG

Protein sequence

MTDEQKNREL DRREFLGISV GAAMLFGMNG YPGLAQDKTG VQYRTLGHTG ERVSCIGLGG 
YHIGIQGSED ESIRIIRRAI DGGINFLDNC WDYNDGGSEV RMGKALRDGY RKRAFLMTKI 
DGHDGKTATK QLEDSLRRLQ TDHLDLLQFH EVIRPTDPDR IFAANGSFEA MQKAKQAGKI 
RYLGYTGHKD PEIHLKMLST ALAHNWTPDS VQMPLNVMDT HFNSFEHKVL PELVKHNIGV 
LGMKPMGSGV ILQSKVVTPV ECLTYALSLP TSVVITGCDS MQVVDQALKV AREFKPPSEK 
EVAALRAKTA PVAMAGKYEL YKTSSNFDGT AHNPQWLGGA P