Gene Rleg2_1678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1678
Symbol
ID	6980415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1707910
End bp	1708926
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	58%
IMG OID	643396402
Product	NMT1/THI5 like domain protein
Protein accession	YP_002281192
Protein GI	209549275
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00877169
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.68258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATG CACTGAAGAA TACGGTCTTT TCCGCGCTCA TGGGCCTTGG TGGCGCGCTC 
GCCGCTGCCG TTACGGCGCA TGCGGCCGAC AAGGTGAGCT ACGGAACGAA CTGGCTGGCA 
CAGGCCGAGC ACGGCGGCTT TTACCAGGCG GTCGCCGACG GCACCTATAC GAAACACGGC 
CTCGACGTCA CGATCGTGCA GGGCGGCCCG AACGCGGCCA ACAGCGCGCT GCTGATCTCC 
GGCAAGATCG ATTTCTACAT GGGTGGGCCG CAGGGCGAGG TATCGGCTGT CGAACAGGGC 
ATTCCGCTGG TCGATGTCGC GGCGATCTTC CAGAAGGATC CGCAAGTCCT GATCGCCCAT 
CCGGATGCGG GTATCGATAA ATTCGAGGAT CTCGCCAAGC TCAAGACCTT GTTTCTCAGC 
AAGGACGGTT ACCTCACCTA TTTCGAATGG ATGAAGGCGA ACTTCAAGGG CTTCAAGGAC 
GAGCAGTACA AGCCCTACAA TTTCAGCGCC GCGCCGTTCC TTGCCGACAA GCAATCCGCC 
CAGCAGGGTT ACCTCACCTC CGAGCCCTAC GAGATCCAGA AGCAGGCCGG CTTCGAACCG 
AAGGTCTTCC TGCTCGCCGA TAACGGCTAT TCGCCCTATT CGACGATGAT CACCACCACG 
CAGACGATGG TCGACAGCAA GCCGGATGTC GTCCAACGCT TCGTCGATGC CTCGATCGAA 
GGCTGGTACA ACTATCTCTA CGGCGACAAC AGCAAGGCGA ACGAGCTGAT CAAGAAGGAC 
AATCCTGAAA TGACGGATGG CCAGATCGCC TACTCCATCG CCAAGATGAA GGAATACGGC 
ATCATCGAAT CCGGCGACAG CCTGGACAAG GGCATCGGCT GCATCACCGA CGCGCATTAC 
AAGGCGTTTT TCGACGAGAT GGTAGCGATC AAGGTGTTCA AGCCGGAGAC CGACTACACC 
AAGGCCTTCA CGACGAAATT CGTCTGCAAG AACATCGGAA TGGCGATGAC GAAGTAG

Protein sequence

MPNALKNTVF SALMGLGGAL AAAVTAHAAD KVSYGTNWLA QAEHGGFYQA VADGTYTKHG 
LDVTIVQGGP NAANSALLIS GKIDFYMGGP QGEVSAVEQG IPLVDVAAIF QKDPQVLIAH 
PDAGIDKFED LAKLKTLFLS KDGYLTYFEW MKANFKGFKD EQYKPYNFSA APFLADKQSA 
QQGYLTSEPY EIQKQAGFEP KVFLLADNGY SPYSTMITTT QTMVDSKPDV VQRFVDASIE 
GWYNYLYGDN SKANELIKKD NPEMTDGQIA YSIAKMKEYG IIESGDSLDK GIGCITDAHY 
KAFFDEMVAI KVFKPETDYT KAFTTKFVCK NIGMAMTK