Gene Acid345_0413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0413
Symbol
ID	4068731
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	474487
End bp	475665
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	60%
IMG OID	637982416
Product	HI0933-like protein
Protein accession	YP_589492
Protein GI	94967444
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0650019
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0294705
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGCTC CATCCCAACT TCATTACGAC GTCATCATCC TTGGCGCCGG TGCTGCCGGA 
CTCATGTGCG CCATCGAGGC CGGTAAGCGC GAACGCCGTG TCGTCGTCCT CGATCGCGCC 
GAGAAGATCG GCAAGAAGAT CCTCATCTCT GGCGGTGGAC GCTGCAACTT CACCAACCTT 
CACACCACGC CGGCAAACTT CCTCAGCGAG AATCCGCACT TCTGTAAATC CGCCCTCGCC 
CGCTACACAC CGTCGGATTT CATCGCCCTC GTCGAGAAGC ACAACATCCC GTATCACGAG 
AAAACGCTAG GCCAACTCTT CTGCGACCGT TCCGCACGCG ACATCGTCCA CCTTCTCGAA 
ACGGAATGCA CCGCCGCCGG CGTGCGCATC GTCACCAACT CTCTCGTGCA AGAAGTTCGC 
CGCGCCGACG AATTCATCGT GATCGCCGAC TCCGCCGAAT ATCGTGCCCC CGCGCTGGTT 
GTCGCCACCG GTGGCCTCTC CATCCCGAAG ATCGGCGCCA CATCTCTCGG CTATGACATC 
GCCCGCCAAT TCGGATTGAA CATCATTGAA CCGAGCCCCG CGCTAGTCCC GTTCACCTTC 
AACGACGAAG ACTCCGCCAC CTACAGTGAT CTCACCGGCC TCTCCGCCGA CGTCATCGCC 
TCCTGCAACG GGGCTCACTT CCGCGAGAAG ATGCTCATCA CCCATCGTGG CCTCAGCGGC 
CCATCGATTC TTCAGATTTC TTCTTACTGG CGTTCCGGTG AAACCATCAC CCTCGATCTC 
GCCCCCGCAC AGGACGTCAC GAGCGCTCTT CGCGCCCATC CCGCAGGGCG CAACGAATCT 
TCATTGAAGT CCGAATTCCG CAAAGTTCTC GCGCAACGTC TTGCCGATCG CTGGGTCGAA 
CGTCATCTCC CGAAATCCTG GACCAACCAC GCCCTCGAAG ACCTCGAACG TCAAGCGCAC 
GCATGGAAGA TCGTCCCCGC TGGCACCGAA GGCTTCGAAA AAGCCGAGGT CACTGCCGGC 
GGTGTGGACA CCAACGAACT CTCCGCCAAA ACCATGGAGA GCCGCAAAGT CGCAGGTCTT 
TATTTCATTG GAGAGGTGGT GGACGTCACC GGCCACCTCG GTGGTTTCAA CTTCCAGTGG 
GCATGGGCCT CCGGCTATTC AGCCGGACAG GCCATCTAA

Protein sequence

MNAPSQLHYD VIILGAGAAG LMCAIEAGKR ERRVVVLDRA EKIGKKILIS GGGRCNFTNL 
HTTPANFLSE NPHFCKSALA RYTPSDFIAL VEKHNIPYHE KTLGQLFCDR SARDIVHLLE 
TECTAAGVRI VTNSLVQEVR RADEFIVIAD SAEYRAPALV VATGGLSIPK IGATSLGYDI 
ARQFGLNIIE PSPALVPFTF NDEDSATYSD LTGLSADVIA SCNGAHFREK MLITHRGLSG 
PSILQISSYW RSGETITLDL APAQDVTSAL RAHPAGRNES SLKSEFRKVL AQRLADRWVE 
RHLPKSWTNH ALEDLERQAH AWKIVPAGTE GFEKAEVTAG GVDTNELSAK TMESRKVAGL 
YFIGEVVDVT GHLGGFNFQW AWASGYSAGQ AI