Gene Mflv_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_1149
Symbol
ID	4972475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	-
Start bp	1189851
End bp	1191101
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	73%
IMG OID	640455345
Product	hypothetical protein
Protein accession	YP_001132419
Protein GI	145221741
COG category	[A] RNA processing and modification
COG ID	[COG5178] U5 snRNP spliceosome subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.10821
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0204141
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCACCG CGCTCCCCGA CACCGACCCG ACCGGCGGAC TGACCGCGAA CTCCATCTCC 
CTCGGACCGC GCGGCAACGA CACCTTCGAC CACGCCAAGA GAGGTGACTG CCTCACCTGG 
CCGGACCGCA CGCCCGACGC CGCCGAGATC GTCGACTGCG CCGGTGAGCA CCGGTTCGAG 
GTCGCCGAGT CGGTGGACAT GGGCACCTTC CCCGGAAGCG AGTACGGACC CGACGCGGCG 
CCGCCGTCAG CGGCCCGGAT CCAGCAGATC AGCCAGGAGC AGTGCTCGGC GGCGGTGAAG 
CGCTACCTGG GCGCGCGGTT CGACCCCAAC AGCCGGTTCA GCGTCAGCAT GCTGTGGTCC 
GGCGACAAGG CCTGGCGCCA GTCCGGCGAG CGCAGGATGC TGTGCGGACT GCAGCTGCCC 
GGCCCGAACA ACCAGCAGCT CGCGTTCACC GGACGGGTCG CCGACGTCGA CCAGTCCAAG 
GTCTGGCCGG TCGGCACGTG TCTGGGCATC GACCCGGCGA CCAACCAGCC GACCGACATC 
CCCGTCGACT GCGCCGCCCC GCACGCGATG GAGGTGACCG GCGCGGTCAA CCTGGCCGCG 
AAGTTCCCGG CCGCGCTGCC CCCGGAGCCC GAGCAGGACA CGTTCATCAA GGACGAGTGC 
ACGAAGATGA CCGACGCCTA CCTGGCGCCG ATCGAGCTGC GAGAGACGAC GCTGACGCTG 
GTGTACAGCA CGGTGTCGTT GCCGAGCTGG GCCGCGGGCA GCCGCCAGGT GTCGTGCAGC 
ATCGGGGCGA CCCTCGGCAA CGGCGGCTGG TCGACGCTGC TCAACAGCGC CAAGGGTCCG 
CTGATGATCA ACGGACAGCC GCCCGTCCCG CCGCCGGACA TCCCGGAGGA ACGGCTGTCG 
CTGCCGCCCA TCCCGGTGCC CGACTCGTCG TCGGGCAGCT CCAGCTCGTC GAGTTCGTCG 
GGGTCCTCCA GCTCGTCGGG GTCCTCGGAC TCGTCGGGAT CCTCGGACTC GTCGTCGGGC 
AGCAGCCAGA GCGAGGACCA GACGGTCCAC GGGCCGCAAG CCCCTGCGCC CGCGCCGACC 
GAGCAGCCGC CGGTCAATCC GGCGCCGCCG CCCCCGGCCG CGGCGCCCGC CGACCAGCTG 
CCGCCACCGG GCCCCCTGCT TCTGCCGCCG CCCCCGCCGC CGCCCGCTCC CGTGGCCGGG 
CCCCCGGCCG AGCCGCTGCC GCCCGGACCT CCGCCTCCAC CGGGGGTGTA G

Protein sequence

MITALPDTDP TGGLTANSIS LGPRGNDTFD HAKRGDCLTW PDRTPDAAEI VDCAGEHRFE 
VAESVDMGTF PGSEYGPDAA PPSAARIQQI SQEQCSAAVK RYLGARFDPN SRFSVSMLWS 
GDKAWRQSGE RRMLCGLQLP GPNNQQLAFT GRVADVDQSK VWPVGTCLGI DPATNQPTDI 
PVDCAAPHAM EVTGAVNLAA KFPAALPPEP EQDTFIKDEC TKMTDAYLAP IELRETTLTL 
VYSTVSLPSW AAGSRQVSCS IGATLGNGGW STLLNSAKGP LMINGQPPVP PPDIPEERLS 
LPPIPVPDSS SGSSSSSSSS GSSSSSGSSD SSGSSDSSSG SSQSEDQTVH GPQAPAPAPT 
EQPPVNPAPP PPAAAPADQL PPPGPLLLPP PPPPPAPVAG PPAEPLPPGP PPPPGV