Gene Acid345_0624 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0624
Symbol
ID	4070119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	766313
End bp	767350
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	62%
IMG OID	637982629
Product	hypothetical protein
Protein accession	YP_589703
Protein GI	94967655
COG category	[R] General function prediction only
COG ID	[COG1090] Predicted nucleoside-diphosphate sugar epimerase
TIGRFAM ID	[TIGR01777] conserved hypothetical protein TIGR01777

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.9123
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGATCG TGATCCCGGG TGAGTCTGGA CAAGTCGGAA CGATTTTGGC TCGCGCCTTT 
CACCGCGACG AGCATGAAGT GGTTGTGCTC AGCCGCCGTG CACAGGTCCA GCCGTGGCGC 
GTCATCGTAT GGGATGGGGC AGCGCTCGGC GATTGGGCAA AAGAACTGGA TGGCTGCGAC 
GTGGTGATCA ACCTCGCGGG GCGCAGCGTC AATTGCCGAT ACTCAGAGGC CAATCGGAAG 
GAAATCCTCG ACTCCCGCGT GTTGTCGACA CGAGTCGTCG GGCAAGCGAT TGCGAATGCC 
GGGCGGCCGC CGCGCGTGTG GCTGCAGGCG AGCACCGCCA CGATCTACTC GCATCGTTAC 
GACGGCCCGA ATGACGAGAT ATCGGGTCTC CTCGGCGGCG AGGAACCCAA CGCCCCGAGT 
TCCTGGCGAT TCAGCATCGA GGTTGCCCGC GCCTGGGAAG GCGCGTTCCA TGAAGCGAAG 
ACCGTCCACA CCCGCAAGGT CGCGCTGCGT TCGGCAATGA CGCTGAGCCC CGATCGCGGT 
GGAGTGTTCG ATGCGCTTGT TGGCCTGATG CGGCATGGCC TGGGCGGGCG CGCCGGCGAT 
GGGCGGCAGT TTATGTCGTG GATTCACTAC GAGGACTTCG TGGCGGCCAC TGGCTGGCTG 
ATCGATCACG ACGACATCGA GGGAATCGTT AACGTCGCCG CTCCGGCTCC GTTGCCGAAC 
GCAGAGTTCA TGCGTGCGCT GCGGGCTGCT TTCGGGATGC CGCTTGGACT CCCTGCTAGC 
AAACGGATGC TGGAGATCGG CGCCGTCTTC CTTCGGACGG AAACCGAACT CATTTTGAAG 
AGCCGTCGAG TGGTTCCAAC CAGATTGCTT GATCATGGAT TCAAGTTCAG ATTTCCGACG 
TGGTCGGATG CGGCAGGCCA CCTCTGCCGA CAATGGCTGC TGACCCGCAG CCAACAAAAA 
AGGCTGGCGC GGAGGACGCC AGCCGGAGGC AACGAGTTCA ACTGTGTTAG AAGCGGAAGA 
TCCCTGAGAA TTCCATGA

Protein sequence

MKIVIPGESG QVGTILARAF HRDEHEVVVL SRRAQVQPWR VIVWDGAALG DWAKELDGCD 
VVINLAGRSV NCRYSEANRK EILDSRVLST RVVGQAIANA GRPPRVWLQA STATIYSHRY 
DGPNDEISGL LGGEEPNAPS SWRFSIEVAR AWEGAFHEAK TVHTRKVALR SAMTLSPDRG 
GVFDALVGLM RHGLGGRAGD GRQFMSWIHY EDFVAATGWL IDHDDIEGIV NVAAPAPLPN 
AEFMRALRAA FGMPLGLPAS KRMLEIGAVF LRTETELILK SRRVVPTRLL DHGFKFRFPT 
WSDAAGHLCR QWLLTRSQQK RLARRTPAGG NEFNCVRSGR SLRIP