Gene Acid345_0742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0742
Symbol
ID	4069084
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	914127
End bp	915194
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	58%
IMG OID	637982748
Product	NHL repeat-containing protein
Protein accession	YP_589821
Protein GI	94967773
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.150031
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGACGTAC GAGGAGCAAG GGCCGCAGTA CTTACCTTGT CGATCCTCGT TCCTTTGACG 
TGCCTTGCCG CAACGAAAGA GAAGCCCGCA GAAGTTTCGG TTCCGGCGAT CGAGATTGAG 
GGTGGACGAC GCCTCACCTT CGAGCGGATG TTTACGACCG ATCGTGACGT CCTCGGCAAG 
AAAGGCTTCT GGACGAAGGT GGTGGACTTC GTCGCCGGTG AACCAGACGA ACATTTCCTA 
GTCAGACCCT ACAGTATCGC GGTGGATTCG CGCGGGCGAG CGATTGTCAC CGATCCGGGC 
GCGAATGGCG TGCACATCTT CGACCTCGCC CAGCATAAGT ACAAGTTCGT CGAACGCAAT 
GAGAAGGGCA AAGAGTCGAT GCTCCAGCCG CAATGCGTGG CGGTGGATGC GCACGACAAC 
TTCTACGTCA CGGACTCTGA GACCGGCAAG GTCTTCGTCT TTAATGCTGA CGGCAAGTAT 
CAGCGCTCGA TTGGCGCCTT GAAGGGTGGC GAAGGATTCT TCAAGCGGCC TACCGGGATT 
GCGATTGATT CGGCGGCACA GCGCGTGTAC ATCACCGACA CCCTACGCGA CAAGATTTAT 
GTCACCGACA TGCAGGGCCA AGTACTTGCC ACGATCGGCA AGCCGGGATC GGAACCTGGC 
GAATTGCACT ATCCGACCGA ACTGCGCATT GTGGGCGACG AGCTGGTGGT GGTGGATGCG 
ATGAACTTCC GCATCCAGAT CTTCGGAAAA GATGGCAGCT ATCGCGGCAG CATTGGCGAG 
ATCGGCGATA CGCCGGGCGC GATGTTTCGT CCCAAGGGCG TGAGCGTGGA TTCCGAGAAC 
CACATCTACG TGGTGGAAGG TGCGAGTGCG CGGGTACAGA TTTACGACCG CGAAGGCCAC 
TGGCTGTACT GGTTTGGCGG AAAAGGCACG GGGCCTGAGG AGTTTCAGCT TCCTTCCGGC 
ATTTTTATTG ACCACGAGGA CCGCATCTTC GTGGTTGACT CGTTTAATCG CCGGATCCAA 
GTGCTGCATT ATTACGGCGT CGGTAAGCGT GCAGGAGGCC AGCCATGA

Protein sequence

MDVRGARAAV LTLSILVPLT CLAATKEKPA EVSVPAIEIE GGRRLTFERM FTTDRDVLGK 
KGFWTKVVDF VAGEPDEHFL VRPYSIAVDS RGRAIVTDPG ANGVHIFDLA QHKYKFVERN 
EKGKESMLQP QCVAVDAHDN FYVTDSETGK VFVFNADGKY QRSIGALKGG EGFFKRPTGI 
AIDSAAQRVY ITDTLRDKIY VTDMQGQVLA TIGKPGSEPG ELHYPTELRI VGDELVVVDA 
MNFRIQIFGK DGSYRGSIGE IGDTPGAMFR PKGVSVDSEN HIYVVEGASA RVQIYDREGH 
WLYWFGGKGT GPEEFQLPSG IFIDHEDRIF VVDSFNRRIQ VLHYYGVGKR AGGQP