Gene Acid345_4571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4571
Symbol
ID	4071516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5417574
End bp	5418887
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	56%
IMG OID	637986611
Product	HipA-like
Protein accession	YP_593645
Protein GI	94971597
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.31649
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGA CTAGGGTCGC CGACACTCGC CCAAGCACGT TGCTTGTGAA GCTTGGCGAC 
ACCGCGGTGG GCACGATCAC ACAGCTTGGG GGCTTCGACA GAAATCTGTT TGCATTCGAC 
GCGGCCTACC TTGCCGATGC GCAGCGGCCG ACGTTAAGTC TCAGTTTTCT GGATGTGGAG 
GGGCAACCGA GAATCACGGA ACAACTCACG CGAAGCAAGG TCCCACCGTT TTTTTCCAAC 
CTGCTACCGG AAGGGATGCT TCGTGAGTAC CTGGTCGAAC GAACGGGAAT ACCGTCGGAA 
AAAGAGTTCC TACTGCTGTG GATGGTGGGG AGGGATTTAC CGGGAAATGT GATCGTCGAG 
GACATGGAGG GCCGTCCATC GCCGCCTCTT TCGGAGTATC TCGGCGGCAG ACTATCGCTC 
ACTGCGAACC GTCGCGCTGC CCCTCTACCC CGCTTTTCCT TAGCGGGAGT GCAAATGAAG 
TTCGGCGCGG GGAAGCACCC TGGCAATCGG CTCAGTATTC CGGCGCGGGG ACTTGGCGGA 
GATTGGATCG TGAAGCTACC GTCTCCACAG TACGATTCGC TGCCTGACAA CGAGTACTCG 
ATGATGATGC TTGGCAAAGA CATCGGCATC GACGTGCCTG AGTTTGGGTT AGCAACTACG 
AAACGTATAG AAGGAATTCC GGAGGGATTT GCGAATCTCG ATGCGAATGC CTACTACGTA 
AAGCGCTTCG ATCGGACGCC CAAGTCGCGG ATTCATATCG AGGACTTCAA TCAAATCTTC 
GGCCAGTTCC CCGATCAGAA ATATGGGAAG CAAAGTTACA ACGCTATCGG AAAGAACATC 
TTCAGAATTC TGGGTGAAGC GGATTATCGG GAGTTTGTGC GACGGCTGGT TTTCAGCATC 
CTCGTCGGCA ACATGGATAT GCACCTGAAG AATTGGTCCG TGGTGTACAA GGATGGCCGA 
ACACCAAGGC TCTCTCCGGC TTACGATCTT GTCTCGACAA TTGTGTACCC TGGGATCGAC 
AAGGCGTTGC CGCTCTCCTT CGCGGGCACG AAAGATGCGC AGCAGGTGGA TGAGGATTTG 
CTCGTAAGCT TCGCCGCAAA AACCGAGGCC CCGCGCAACT ACGTACTCGA AACGGCGACC 
GAGACGGTAC GCAGCTTCAA AGATGCGTGG TCCGCAAAAG CAAAAGACCT GCCTTTGCGA 
AAAGAGTGGA GAGAGATGAT TTCGGCTCGC CTCGCGACCC TGCCAATCGC CAACCTGGGA 
TCGCAGGAAA CCACCAAGAA AAGACGACGA GGAAGGCCGC GGCGCGGCGC GTGA

Protein sequence

MKKTRVADTR PSTLLVKLGD TAVGTITQLG GFDRNLFAFD AAYLADAQRP TLSLSFLDVE 
GQPRITEQLT RSKVPPFFSN LLPEGMLREY LVERTGIPSE KEFLLLWMVG RDLPGNVIVE 
DMEGRPSPPL SEYLGGRLSL TANRRAAPLP RFSLAGVQMK FGAGKHPGNR LSIPARGLGG 
DWIVKLPSPQ YDSLPDNEYS MMMLGKDIGI DVPEFGLATT KRIEGIPEGF ANLDANAYYV 
KRFDRTPKSR IHIEDFNQIF GQFPDQKYGK QSYNAIGKNI FRILGEADYR EFVRRLVFSI 
LVGNMDMHLK NWSVVYKDGR TPRLSPAYDL VSTIVYPGID KALPLSFAGT KDAQQVDEDL 
LVSFAAKTEA PRNYVLETAT ETVRSFKDAW SAKAKDLPLR KEWREMISAR LATLPIANLG 
SQETTKKRRR GRPRRGA