Gene Acid345_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1984
Symbol
ID	4069370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2378030
End bp	2379424
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	59%
IMG OID	637983997
Product	YVTN beta-propeller repeat-containing protein
Protein accession	YP_591059
Protein GI	94969011
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02276] 40-residue YVTN family beta-propeller repeat

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.584863
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG CACTGATACC CGCGCTGCTT GGCTTAAGCT TGTGCGGCGC GGCGCAATCC 
GTCGACCGCG TCTACACCGC GGACCAAACC TCCAACACCG TTAGCGTGAT CGATCCCGTA 
GCGAACCGGC TTCTTGGCGA GATTCGGCTG GGCGAAAACG TGCCCACGGC TATCAGTCCG 
CTCTACCGAG GCCAGCTTCT GGTGCACGGG TTGGGCTTTT CGCCCGACCA CAAGACGATC 
GACGTCATCT CGATCGGATC GAATGCCGTT ACGTTGATTG ACACGCAGAG CAACACCGTC 
AAGGGCACGG TCTATGTCGG ACGGTCGCCG CACGAAGGAT TCTTTACCTC GGACGGCAAA 
GAACTATGGG TGGCGGTACG TGGAGAAAAC TACGTCAGCG TCATCGATCC GATCGCAATG 
AAGGAAGTCC GCCGCATTGA AACCGCGAAT GGACCTGGGA TGGTCCTGTT CCGTCCCGAC 
GGCAAGCTTG CTTTCGTCCC CTCCAGTTTC ACGCCGGAGC TCGATGTTAT CGACACCTCC 
ACCTATCGCG TCATCGCTAG AATTCCCCAG GTCAGCCCGT TCTCGCCAAA TCTGGCCGTT 
GATCAAGACG AGGTGTGGTT CACCCTGAAA GATACTGGCA AAACCCAGAT CATCAGCGCG 
CAGCCTCCGT TTAAAACCAT CGCGACTCTC GAGACCGGAC CGATCACCAA CCACGTAACC 
CTGATCGAAA ACAGCAAAGG AAAATTCGCC TACGTCACCG TAGGTGGGAA GAATGAGGTG 
CTTGTCTACC AGCGCGGATC GGGCGCGGAA CCGAAGCTGG TAAGCACAAT TCAAGTTGGA 
GACTTGCCGC ACGGCATTTG GGGCTCGGGC GATGGAAAGC GCGTTTACAT TGGCCTCGAG 
AACGGCGACG CCGTCCAGGC CATCGACACT GCCACGAACC GCGTCATTGC GACGATTCCA 
GTAGGGCAAC TGCCCCAGGC GCTAGTCTAC GTTCCCGGCG CCGCCTCCTC AGATGCAGGA 
ACAGCGAGTC TGAAGCCATT CAGCACTGCA ACCGACGCTC TGCACATCGA GATGGTCTCG 
GCTTCGTCAG CGAGTCCGTC GACTCACGCC AGCGTAGTCG TGAATCCGAT CGGCCCGATT 
GATAACCTGC AGATCGCGGC CACAGGCCTC ACTCCGAAGC AGGGGTATCG CCTCATGCTC 
ACCGGCGCAT CGAGTTCCCA GGAGCTTGTG GTCTTCACTG CCGGACCCGG CGGCGTCGGC 
ATTGCGCAGA CCTTCGGGCC GTTGAAGCAT GCCGTCGATC CTGCCCAAAG CAGCGATTCG 
TTTGCGCTGG AAGTTTGGAC ACTCGACGCG GATGGAAAAC ACCATGTCGT ACTTCACGAA 
GCTCCGCGCC ATTGA

Protein sequence

MRIALIPALL GLSLCGAAQS VDRVYTADQT SNTVSVIDPV ANRLLGEIRL GENVPTAISP 
LYRGQLLVHG LGFSPDHKTI DVISIGSNAV TLIDTQSNTV KGTVYVGRSP HEGFFTSDGK 
ELWVAVRGEN YVSVIDPIAM KEVRRIETAN GPGMVLFRPD GKLAFVPSSF TPELDVIDTS 
TYRVIARIPQ VSPFSPNLAV DQDEVWFTLK DTGKTQIISA QPPFKTIATL ETGPITNHVT 
LIENSKGKFA YVTVGGKNEV LVYQRGSGAE PKLVSTIQVG DLPHGIWGSG DGKRVYIGLE 
NGDAVQAIDT ATNRVIATIP VGQLPQALVY VPGAASSDAG TASLKPFSTA TDALHIEMVS 
ASSASPSTHA SVVVNPIGPI DNLQIAATGL TPKQGYRLML TGASSSQELV VFTAGPGGVG 
IAQTFGPLKH AVDPAQSSDS FALEVWTLDA DGKHHVVLHE APRH