Gene Emin_0324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0324
Symbol
ID	6263559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	345065
End bp	346105
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	41%
IMG OID	642610789
Product	putative poly-gamma-glutamate biosynthesis (capsule formation)-like protein
Protein accession	YP_001875220
Protein GI	187250738
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.491036
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.1082
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCGG ATTTGTTTAA ACCTTCATTT TTCGTTTTGC TTTTGGCAGC TTTTGTTTGT 
GCTTGCTCTT CAAACAGAAC GCAGAGTTCG GCTTTCCCGT GGCATGAATA TGAAAAGGTT 
GCGCAGGAAC TTACCGTCAG CGGGCAGACG GAAGAGGATT CCAATGCGGA AGTTTGCGCC 
GTTCCGGGGC GTGTTATAAC GCTTACTTTC GCGGGCGATA CCACGATGGG AGATTATCCC 
GAGCAACAGG GTATGACTTT TAACTGGCAG TATAAGCAGC TAAAGGGCGA TAAGAAATAT 
TTTTTAAAAA ATATGCTGCC TATGTTTACT ACGGACGATT TTACAATAGT TAACCTTGAG 
GGCGCCATTA CGGATAACGA CGAAGCGCAG GAAAAGGAAT TTCGCTTTAA AGGCCCTTAC 
GAATACCTGG ATATCCTTAA AGCCGGCAGC GTTGAAATGG TTAATATGGC CAATAACCAT 
ACGCATGATT ACGGTGTAAA AGGTTACAAT GACACAAGGG AAAATCTTAA AAAAGCGGGT 
ATTGCTTTTT TCGGTTATGA TGATTTGATA GTAAAAGAAC TGCATGAGAC AAAGCTTTGT 
TTCCACGGGT TAAAGGGTTT TGACTGGAAC CGGGACAGCA AAATGCTTTT AAAACACTTA 
AAACATTTTA AAGAAATTAA TTGTGATATT ATCATAACCA CTTTTCACTG GGGTGAGGAA 
AAAGCTTATG AAAATAACGC CTTGCAGGAA CGCCTTGCCC GTTTAGCTGT TGATAACGGA 
AGCAGTTTAA TTATAGGACA TCATGCGCAT GTGGTGCAAA ATATTGCACA ATATAAAGGT 
GTAACCATAG TATACAGTTT GGGAAACTTT GTTTTCGGCG GAAATAAAAA CCCGGCAGAC 
AAACGCGCCC TTTTATACCG TGTAAAAATA CAAGACGGCA AAATAATAAG CGCGAACCCC 
GTAAAAATTT TAATATCATC AGAAAAGGCA CGCAATAACT ACCAGCCGGT TTTTGACGGC 
GAGTATCAGG ATTTATTATA A

Protein sequence

MRADLFKPSF FVLLLAAFVC ACSSNRTQSS AFPWHEYEKV AQELTVSGQT EEDSNAEVCA 
VPGRVITLTF AGDTTMGDYP EQQGMTFNWQ YKQLKGDKKY FLKNMLPMFT TDDFTIVNLE 
GAITDNDEAQ EKEFRFKGPY EYLDILKAGS VEMVNMANNH THDYGVKGYN DTRENLKKAG 
IAFFGYDDLI VKELHETKLC FHGLKGFDWN RDSKMLLKHL KHFKEINCDI IITTFHWGEE 
KAYENNALQE RLARLAVDNG SSLIIGHHAH VVQNIAQYKG VTIVYSLGNF VFGGNKNPAD 
KRALLYRVKI QDGKIISANP VKILISSEKA RNNYQPVFDG EYQDLL